18.01.2025
В этом году планируется добавить в модель функцию голосового общения и разработать удобный интерфейс.
Национальный научно-практический центр «Тіл-Қазына» при Комитете языковой политики Министерства науки и высшего образования представил первые результаты работы модели обучения казахскому языку «Tilqazyna», созданной на основе искусственного интеллекта. Модель может решать разные задачи, к примеру, генерировать текст на казахском языке, создавать перифразы, исправлять всевозможные ошибки, работать с контекстом, сокращать тексты, раскрывать значения фразеологизмов и переводить термины.
Эта языковая модель, загруженная на платформу Hugging Face, доступна всем пользователям и открывает возможности для разработки IT-продуктов на казахском языке. Эксперты центра обработали огромные объемы данных. Например, проанализировано более 684 000 лексических единиц для проверки слов, 20 000 словосочетаний для исправления ошибок, 5 558 текстов для анализа пунктуации, а также 6 000 предложений для сокращения. Общий объем корпуса казахского языка составил 35 ГБ.
В этом году планируется добавить в модель функцию голосового общения и разработать удобный интерфейс. Через год проект будет способен обучать казахскому языку на уровнях B2 и C1. Конечная цель — создание голосового помощника, который будет ориентироваться на уровень знаний пользователя и предлагать ему определенные программы обучения. Он станет доступен через мобильное приложение для iOS и Android.
Редактор