Превод на фразеологизми с помощта на изкуствен интелект
Елена Крейчова
Изкуственият интелект (ИИ) трансформира много области на нашия живот, като областта на превода и преводаческата индустрия не прави изключение. Бързото развитие на изкуствения интелект помага за премахването на езиковите бариери. В допълнение към светкавичните преводи на текстови съобщения, най-новите модели ИИ могат дори да превеждат симултанно говоримия език. Тази функция на ИИ ще обслужва не само ежедневните комуникативни ситуации, напр. туристите по време на почивка в чужбина, но ще намери приложение например и по време на международни бизнес преговори и редица други ситуации.
Базираните на ИИ инструменти за превод стават все по-популярни през последните години и много компании ги използват при предоставяне на преводачески услуги. Инструментите за превод с изкуствен интелект могат да превеждат текст бързо и точно, което ги прави привлекателен избор за фирми и физически лица, които се нуждаят от бързи преводи. Използването на изкуствен интелект в преводаческите услуги нараства поради напредъка в компютърната обработка на естествения език. Инструментите за превод с изкуствен интелект използват огромни количества данни и подобряват точността си с течение на времето. Това означава, че колкото повече се използва софтуерът, толкова по-добър става при прецизния превод на текст.
Въпреки че изкуственият интелект предлага невероятни възможности в областта на превода, все още има някои ограничения, които трябва да се имат предвид. Специалистите по превод често посочват, че машинните преводи може да не успеят да оценят правилно контекста и културните специфики на изходния език.
Към момента преводът с помощта на ChatGPT показва известни недостатъци в областта на идиомите или културните специфики на дадения език. Въпреки че превежда много точно съдържанието, то не се доближава до качеството на професионалния превод. Друга трудност е фактът, че за разлика от професионалния преводач, той не може да разпознае напълно контекста на определен израз или изречение, което след това води до неправилен превод.
За целите на настоящия текст избрахме да проверим как ИИ предава семантиката на някои български фразеологизми с доста висока фреквентност в езика, а също така анализираме превода на тези фразеологизми на чешки, направен от ИИ. Фразеологизмите винаги представляват предизвикателство при превод, защото те се отличават със семантична неделимост (независимо от броя и семантиката на отделните компоненти на фразеологизма), устойчивост на лексикалния си състав, непроменлива структура, образност, емоционалност и експресивност. Чешкият езиковед Фр. Чермак (1982) характеризира фразеологизмите като устойчива комбинация от минимално две форми (морфеми, лексеми, колокации, изречения), която се отличава с аномалии във формално, колокационно и семантично отношение и представлява единица от по-високо ниво. Става дума за устойчиво словосъчетание, чието значение, отчасти или изцяло, не може да бъде извлечено от значението на отделните негови компоненти (Čermák 2017a). Също така използваме и дефиниция на фразеологизмите от българската фразеологична школа – тази на К. Ничева, която посочва, че „фразеологичната единица е общоизвестна в даден речеви колектив свръхсловна, разделно оформена, относително устойчива, възпроизводима езикова единица с единно значение, съставена от лексикални единици, чието значение е повече или по-малко избледняло или напълно се е десемантизирало, близка (но не равна) семантично и функционално до думата; по структура фразеологичната единица е словосъчетание или отворено (рядко затворено) изречение и по правило има ярка експресивност“ (Ничева 1987: 19).
За целите на нашето изследване използвахме инструмента Microsoft Copilot, който представлява базиран на изкуствен интелект асистент, който Microsoft внедрява в своите операционни системи и приложения. Везплатната версия на Copilot предоставя достъп до GPT-4 Turbo.
Първата задача на ИИ беше да каже какво е значението на подсочения фразеологизъм, а следващата – да преведе фразеологизма на чешки език.
Първият фразеологизъм е „на куково лято“. Българските фразеологични речници посочват неговото значение по следния начин: нещо, което никога няма да се реализира (Банова – Димова 2014); за подчертана увереност, че нещо няма да се осъществи; никога (Вътов 2019). Когато попитаме Copilot за значението на този фразеологизъм, получихме следния отговор: „На куково лято“ е израз, който се използва с ирония и сарказъм. Той обикновено означава много горещо лято, когато температурите са изключително високи. Точната дата или период за „куково лято“ може да варира в зависимост от региона и климата, но обикновено се отнася до периода между края на юни и началото на септември. Прилагателното „куков“ е образувано от диалектното име на кукувицата или на кукера с наставка „-ов“. В някои случаи изразът се използва и като синоним на „никога“ с ироничен подтекст“. При интерпретацията на семантиката е посочено неправилно значение горещ период, само накрая е спомената употреба, синонимна на „никога“. Относно превода на „на куково лято“ ИИ посочва несъществуващ израз на чешки, но обяснява семантиката правилно: „На чешки изразът „на куково лято“ се превежда като „na kukovo léto“. Този израз се използва, за да подчертае, че нещо е много рядко или невъзможно“.
Следващият анализиран фразеологизъм е „от трън (та) на глог“. Българските фразеологични речници посочват неговото значение по следния начин: от лошо на по-лошо. От по-малко зло на по-голямо (Банова – Димова 2014); за неуспешен опит да се избегне нещо нежелано: от по-малкото зло налитам на по-голямото (Вътов 2019). Относно семантиката Copilot посочва правилно: „От трън на глог“ е израз, означава „от по-малкото към по-голямото зло“. Този израз се използва с ирония и сарказъм, за да подчертае неочакваните последствия от дадено действие или решение“. При превода обаче посочва отново несъществуващ израз на чешки, допълва и друг синонимен израз на български, който също не се употребява: „На чешки изразът „от трън на глог“ се превежда като „Gori od gorega“. Този израз се използва, за да подчертае, че когато някой се опитва да избяга от една неприятност, попада в друга. В същия дух, можем да кажем, че „излезе от котлената и попадна в огъня“.
Фразеологизмът „след дъжд качулка“ е посочен със следното значение в българските речници: закъсняло във времето действие, от което вече няма нужда (Банова – Димова 2014); – с голямо закъснение, когато е отминала необходимостта (Вътов 2019). Copilot отново посочва правилно семантиката: „Изразът „след дъжд качулка“ се използва в българския език и означава, че някой намира решение на даден проблем със закъснение, когато вече не е нужно или когато от това няма полза. Този израз се използва с ирония и сарказъм, за да подчертае неочакваните последствия от дадено действие или решение“. Преводът на Copilot също е правилен, дори ИИ избира за преводен еквивалент чешки фразеологизъм със същата семантика. Накрая обаче предлага дословен превод на чешкия фразеологизъм, който е неподходящ: „На чешки изразът „след дъжд качулка“ се превежда като „S křížkem po funuse“. Този израз означава, че някой намира решение на даден проблем със закъснение, когато вече не е нужно или когато от това няма полза. В същия дух, можем да кажем, че някой прави нещо „с кръстчето след погребение“.
Следващият фразеологизъм „мамино синче“ е представен във фразеологичните речници по следния начин: разглезен, разхайтен млад човек, нехранимайко, безделник, който не може да се справи с трудностите в живота, отнася се безотговорно към задълженията си (Банова – Димова 2014); разглезен младеж, който е свикнал всичко да получава наготово (Вътов 2019). Copilot представя доста обширно следното значение: „Мамино синче” е израз, който се използва в българския език. Той обикновено се отнася до мъже с инфантилно момчешко държание, които не могат да поемат отговорност. Причината за това често е майка с твърд характер, която е управлявала живота им с несломима твърдост и е била свръх протектираща. Тези мъже са неуверени и несигурни в себе си, което понякога ги прави агресивни. Обикновено те нямат значителен опит в живота. В общия случай „маминото синче“ сравнява всичко, което правите, с начина, по който го прави майка му, и никога не оценява толкова високо, колкото тя. Нейните молби са заповеди за него, и той не се колебае да провали всички ваши планове, ако това е необходимо на майка му. Ако срещнете някого, който се вписва в този профил, може би сте намерили „маминото синче“. Преводът на Copilot и в този случай предлага фразеологизъм, който е точен преводен еквивалент: „На чешки изразът „мамино синче“ се превежда като „maminčin mazánek“. Този израз се използва, за да се подчертае, че някой е много свързан с майка си и може би е малко прекалено защитаван от нея. Всъщност, това е начин да се подиграваме на човек, който е твърде свързан с майка си“.
Последният анализиран фразеологизъм е „ни лук ял, ни (на) лук мирисал“, който е със значение давам си вид на невинен, преструвам се, хитрувам (Банова-Димова 2014). В речника на В. Вътов (2019) този фразеологизъм липсва. Значението, посочено от Copilot, е следното: „Ни лук ял, ни лук мирисал“ е израз, който се използва в българския език. Той се използва, за да се опровергае някого, който се прави на невинен или се опитва да се измъкне от отговорност. По същество, изразът означава, че не само че човекът не е ял лук, но дори не е усетил неговия мирис. Това е начин да се подчертае, че някой не е невинен, както се опитва да се представи.“ Преводът, посочен от Copilot, всъщност е само транслитерация на българския израз, в него липсват чешки думи. В първата част на интерпретация на семантиката виждаме дословно тълкуване на фразеологизма: „На чешки език изразът „ни лук ял, ни лук мирисал“ се превежда като „ni luk jal, ni luk mirisal“. Този идиоматичен израз се използва, за да се подчертае, че някой не само не е ял чесън, но дори не го е усетил. Това е начин да се подиграваме на човек, който се опитва да се измъкне от нещо, което е направил или не е направил“.
На база на проведеното изследване на анализ на фразеологизми можем да кажем, че едно от основните предимства на живите преводачи е способността им да разбират не само чуждия език, но и историята, културата, общия контекст на процесите, свързани с езика. Това с пълна сила важи и за превода на фразеологизми и устойчиви изрази. Докато ИИ може да овладее речника и граматиката, все още му липсва задълбочено разбиране на контекста, фините езикови нюанси и културните препратки. Не че машинните преводи в момента са лоши (разбира се, много зависи от инструмента, който е използван, а и динамиката на процесите в областта на машинния превод и превода на ИИ върви с много бързи крачки напред), но живият преводач в повечето случаи все пак осигурява по-точен и много по-коректен превод, който наистина отразява оригиналния смисъл на текста.
Въпреки неспорното предимство на ИИ да бъде способен да превежда големи обеми текст за секунди, човешкият преводач засега предоставя текстове с по-високо ниво на език и стилистика. По този начин текстовете, преведени с помощта на ИИ, могат да служат повече като предварителна информация, отколкото като окончателен резултат.
Изкуственият интелект би могъл (и трябва) да се използва – както в полза на комуникиращите, така и на самите преводачи. Това важи особено за ситуации на устен превод, при които преводачи за някои езикови комбинации не са налични, въпреки че са необходими (в най-различни комуникативни ситуации). По този начин устният превод с помощта на ИИ вместо преводач на живо би могъл да реши проблеми, причинени от езиковата бариера в редица ситуации, при които по различни причини наемането на преводачи би било трудно, икономически недостъпно или етично (напр. зони на военни конфликти и др.) (Ченкова 2021: 15).
В заключение можем да посочим, че машинно генерираният превод все още не може да замести изцяло човешката дейност, особено що се отнася до превода на художествена литература, метафорични изрази и езиковата образност.
Благодарности
This study is financed by the European Union – NextGenerationEU, through the National Recovery and Resilience Plan of the Republic of Bulgaria, project № BG-RRP-2.004-0008-C01
Това изследване е финансирано от Европейския съюз – NextGenerationEU, чрез Националния план за възстановяване и устойчивост на Република България, проект № BG-RRP-2.004-0008-C01
Библиография
Банова, М., Димова Ст. 2014. Фразеологичен речник на българския език. Подбрано. А-Я, София: Бан Мар.
Вътов, В. 2019. Фразеологичен речник на българския език за ученици. София: Скорпио
Ничева, К. 1987. Българска фразеология. София: Наука и изкуство
Čeňková, I. Umělá inteligence a tlumočníci – víme, co nás čeká? Acta Universitatis Carolinae Philologica 2 / 2021, st. 105-118
Čermák, F. 1982. Idiomatika a frazeologie češtiny, Praha: Univerzita Karlova.
Čermák, F. 2017. Frazém a idiom. In: CzechEncy – Nový encyklopedický slovník češtiny. Petr Karlík, Marek Nekula, Jana Pleskalová (eds.) URL:https://www.czechency.org/slovnik/FRAZÉM A IDIOM (8. 4. 2024)
Доц. д-р Елена Крейчова е преподавател по български език, по сравнителна граматика на славянските езици и старобългарски език в Катедрата по славистика на Масариковия университет, Бърно, Чехия. Научните й интереси са в областта на сравнителното славянско езикознание, палеославистиката, транслатологията, психолингвистиката, глотодидактиката. Автор на редица речници и учебни помагала по български език като чужд.
Kontakt: ekrejcova@phil.muni.cz
Mohlo by vás z této kategorie také zajímat
- „Словосъчетания и устойчиви изрази (български език като чужд за напреднали)“ и подготовката на бъдещите преводачи (Елена Крейчова)
- Archeologické střípky (Dana Ferenčáková)
- Poznávacia tendencia textu a stratégia autora (Viera Žemberová)
- Slovinští písničkáři (Aleš Kozár)