Prekladateľský softvér DeepL založený na AI sa tento rok prvýkrát objavil na zozname Forbes Cloud 100 vďaka prekladovému modelu strojového učenia, ktorý je podľa používateľov presnejší ako ten od Googlu.
Jaroslaw Kutylowski hovorí po nemecky, poľsky a anglicky (a vie si objednať kolu vo francúzštine). S DeepL, prekladateľským nástrojom jeho startupu poháňaným umelou inteligenciou, môže čítať a písať asi 30 ďalšími.
Spoločnosť DeepL, založená v roku 2017, vyvinula prekladateľský softvér, o ktorom hovorí, že je oveľa presnejší ako konkurenčné produkty ponúkané spoločnosťou Google a inými. A to vďaka výkonnej umelej inteligencii, ktorá spolupracuje s ľuďmi z celého sveta.
Architektúra neurónovej siete DeepL – technika strojového učenia, ktorá pomáha počítaču učiť sa informácie rovnakým spôsobom ako ľudský mozog – bola trénovaná na rozsiahlej databáze verejne dostupného dvojjazyčného (preloženého) a jednojazyčného (nepreloženého) textu v 31 rôznych jazykoch vrátane čínštiny, ruštiny, španielčiny a taliančiny.
Je to síce nepatrný zlomok zo 130 jazykov, ktoré „ovláda“ Google Translate, ale preklady DeepL sú podrobne kalibrované ľudskými editormi a ľuďmi, pre ktorých je príslušná reč ich materinským jazykom. Startup zamestnáva 20 interných editorov a viac ako tisíc zmluvných ľudských prekladateľov z celého sveta, aby posúdili kvalitu prekladov vytvorených modelom DeepL a následne ich upravili.
„Potrebujeme veľa vysokokvalitných údajov preložených ľuďmi, aby sme stroj naučili charakteristiky jazyka na precízny preklad bežného aj formálneho textu,“ hovorí Kutylowski.
DeepL sa môže pochváliť viac ako 10 miliónmi aktívnych používateľov mesačne, z ktorých 500-tisíc platí od deviatich do 59 dolárov za mesiac. To zahŕňa starých rodičov, ktorí používajú DeepL na rozprávanie sa s vnúčatami v ich rodnom jazyku, a romantických partnerov, ktorí zápasia s jazykovou bariérou.
Väčšina podnikania DeepL však pochádza od jej 20-tisíc podnikových zákazníkov – Mercedes Benz, Fujitsu a nemecká železničná spoločnosť Deutsche Bahn, aby sme vymenovali aspoň niektoré –, ktorí používajú softvér DeepL na preklad všetkého od webových stránok, právnych zmlúv až po e-maily, marketingové kópie a PowerPointové prezentácie.
V januári 2023 získal startup so sídlom v Kolíne nad Rýnom v Nemecku podľa Pitchbooku približne sto miliónov dolárov od globálnych firiem rizikového kapitálu vrátane Institutional Venture Partners, Atomico a Bessemer Venture Partners. Generálny riaditeľ a zakladateľ Kutylowski však nepotvrdil celkové finančné prostriedky, ktoré jeho spoločnosť doteraz získala.
DeepL bol stiahnutý do 25 miliónov zariadení, čo je v porovnaní s viac ako jednou miliardou inštalácií služby Google Translate zanedbateľné. Ale tí, ktorí ho používali, si chvália jeho presnosť.
Nina Gafni, profesionálna prekladateľka so sídlom vo Washingtone, DC, ktorá predtým pracovala pre Federal Bureau of Investigation ako lingvistka a prekladateľka, používa DeepL na preklady z francúzštiny, nemčiny a taliančiny do angličtiny. Hovorí, že zatiaľ čo systémy strojového učenia nie sú nikdy úplne dokonalé vo svojich prekladoch, DeepL pozná kultúrne nuansy a je presnejší ako väčšina ostatných.
„Niekedy môžu byť preklady tohto typu príliš doslovné a je to veľký problém,“ povedala Gafni. „Ak mám pred sebou ťažký projekt, mám pocit, že sa môžem na DeepL spoľahnúť oveľa viac ako na Google Translate.“
Je to pravdepodobne kvôli ľudskej kalibrácii z množstva filmových titulkov, prekladov kníh, patentov a konverzácií na fórach využívaných na trénovanie DeepL.
Akiko Taguchi, ktorá pracuje pre DeepL a má japončinu ako rodný jazyk, hovorí, že väčšinu času trávi tým, že sa uisťuje, že preklady DeepL sú kontextovo správne a znejú ľudsky. „Poskytla som stroju svoju spätnú väzbu, keď si zamiešal formality používané v japonskom písaní,“ povedala Taguchi pre Forbes. „Odvtedy sa to výrazne zlepšilo.“
DeepL, ktorý vznikol z prekladacieho a vyhľadávacieho nástroja Linguee, umožňuje používateľom prekladať celé dokumenty, ako sú PDF, Word a PowerPoint, pričom formátovanie zostáva nedotknuté. Navrhuje alternatívne preklady, tónové úpravy a umožňuje používateľom vytvoriť si vlastný slovník, ktorý určuje, ako sa majú určité slová prekladať.
Ako doktorant v oblasti počítačovej vedy Kutylowski vyvíjal technológiu strojového učenia, ktorá je základom DeepL, v roku 2016, v rovnakom čase, keď výskumníci Google pracovali na Transformers, prekladovom technologickom prelome, ktorý poháňa ChatGPT. Ale DeepL aktuálne na preklad nepoužíva Transformers ani veľké jazykové modely, približuje Kutylowski, pričom odmietol špecifikovať presnú architektúru DeepL. „Vedeli sme, že neurónové siete budú v tejto oblasti čoskoro dominovať,“ povedal Kutylowski. „Boli sme presvedčení, že čokoľvek, čo sa predtým používalo na preklad, napríklad štatistické metódy, nebude mať v budúcnosti žiadnu aplikáciu.“
To sa podľa Karthika Ramakrishnana, partnera IVP, ktorý v januári viedol investičné kolo série B spoločnosti DeepL v hodnote sto miliónov dolárov, ukazuje ako pravdivé. Globálny trh prekladateľských služieb má hodnotu 27,9 miliardy dolárov a nie je vôbec dobre využitý. „Prevažná väčšina prekladov je stále manuálna, využíva zastaraný pracovný postup,“ povedal Ramakrishnan. „Ľudia si najímajú externých poskytovateľov jazykových služieb a trvá aj niekoľko dní alebo dokonca týždňov, kým dostanete preložený obsah.“
So svojimi pochvalami a ocenením vo výške jednej miliardy dolárov je DeepL v rozumnej pozícii na to, aby zarobili na trhu, ktorý Ramakrishnan sleduje. Ale v hre sú aj iní. Hoci jeho prekladateľský nástroj nie je taký presný ako DeepL, Google ponúka 130 jazykov a je podporovaný spoločnosťou, ktorá strávila desaťročia investíciami do AI.
Ďalším veľkým technologickým konkurentom je Microsoft Translator, ktorý podporuje viac ako sto jazykov a dialektov a má veľkých podnikových používateľov, ako je Volkswagen Group. Medzitým ChatGPT – bot, ktorý prakticky spustil mániu AI – dokáže v súčasnosti preložiť do 50 jazykov (má však s prekladom množstvo problémov). A konkurentov bude rýchlo pribúdať vďaka neustálemu vývoju špičkových veľkých jazykových modelov.
DeepL svoj vlastný LLM (Large Language Model, v preklade veľký jazykový model) nemá – zatiaľ. Kutylowski pre Forbes povedal, že plánuje jeden interne postaviť a skombinovať ho s jeho súčasným menším prekladateľským modelom pre lepšie výsledky. Za týmto účelom spoločnosť DeepL buduje svoje výpočtové zdroje na trénovanie modelov AI pomocou dátového centra Nvidia zameraného na AI vo Švédsku. „Generatívna AI je obrovská príležitosť,“ povedal. „Umožní nám expandovať funkcie prekladu, čím sa systém stáva interaktívnejším alebo s vami viac vedie dialóg.“
Článok vyšiel na Forbes.com, jeho autorkou je Rashi Shrivastava.