The same page in English Добре дошли
за нас речници документи другите за нас

В памет на нашия учител
ст. н. с. I ст. д. м. н. Георги Гаргов

Тук ще намерите езикови знания и компютърни системи за тяхната обработка:

Граматичен речник на българския език
Словообразувателен речник на българския език
Система за транскрипция на думите
Система за определяне на ударението
Звуково възпроизвеждане на думите

strrulea.gif (1262 bytes)

Какво Ви предлагаме ?
Граматичен речник на българския език

Граматичният речник на българския език съдържа над 60 000 основни форми на думите от основния речников фонд на българския книжовен език. На всяка основна форма е приписана граматична и акцентологична информация. Речниковите единици са групирани в различни граматични класове, подкласове и типове, отразяващи парадигмите от синтетични словоформи и звуковите редувания. Речникът позволява автоматично анализиране (и синтезиране) на словоформите, чийто брой е около 900 000.

Словообразувателен речник на българския език
Предлагаме Ви текущото състояние на разработвания в момента компютърен модел на българското словообразуване. В момента той обхваща около 1350 морфеми, с помощта на които могат да се генерират около 80000 от словоформите в Граматичния речник на българския език. Очакваме коментари и препоръки.

Система за транскрипция на думите
Системата за транскрипция на думите преобразува правописната форма на думите в съответната правоговорна форма .

Система за определяне на ударението
Системата за определяне на ударение автоматично поставя ударението на произволна словоформа, включена в Граматичния речник на българския език.

Звуково възпроизвеждане на думите
Тази разработка е в начален стади.

Какво предстои?
Амбициозна цел на колектива е осигуряването на възможност за анализиране на корпуси от текстове чрез речниците и извличане на обобщени лингвистични справки. Интерес представлява и вграждането на системи за анализ на паралелни дву- и многоезични текстове с цел автоматичното създаване на двуезични терминологични речници. Малко по-далечни цели са създаването на система за граматичен анализ, с която се проверява граматичната коректност на изреченията, и система за автоматичен превод на и от други езици.

Кои сме ние?
Ние сме група млади учени от БАН, които прилагат и развиват съвременни технологии за обработка на естествения език.


mail to: gws@acad.bg Вашите мнения и препоръки са много ценни за нас!
Очакваме ги на адрес: gws@acad.bg