Wersja domyślna

Laniqo dla każdego

Zespół Laniqo. Fot. Władysław Gardasz
Zespół Laniqo. Fot. Władysław Gardasz

 

 

2 listopada ubiegłego roku otrzymaliśmy proof of concept systemu tłumaczenia AMU Translate firmy Laniqo, który zawiera tłumaczenie polsko-angielskie i angielsko-polskie. To efekt współpracy naukowej w ramach Wydziału Matematyki i Informatyki i dziecko pierwszego z uniwersyteckich spin-offów, któremu przewodzi prof. Krzysztof Jassem.  

 

 

– Naszym celem jest zbudowanie aplikacji wspierającej kadrę UAM w pracy nad dokumentami w zakresie ich tłumaczenia i korekty, ze szczególnym uwzględnieniem wymagań środowiska naukowego. Dostęp do wersji testowej był możliwy do końca stycznia 2025 r. – wyjaśnia Kamil Kaczmarek, menedżer projektu i specjalista od systemów tłumaczenia automatycznego AI dla B2B. – Dodam, że dr Marta Kajzer z magistrantami testują obecnie najnowsze wersje i porównują z rozwiązaniami dostępnymi na rynku.  

 

Według naszego rozmówcy wersja produkcyjna AMU Translate będzie zawierała m.in. takie funkcjonalności, jak tłumaczenia między 15 językami najczęściej używanymi w Europie, automatyczne wykrywanie języka, z którego tłumaczymy, a także TextPolisher – moduł korekty dla języka polskiego, angielskiego i niemieckiego. Co niezwykle ważne, w wersji do użytku otrzymamy także tłumaczenie dziedzinowe naukowe, prawne i medyczne dla tłumaczeń polsko-angielskich. System będzie tłumaczył dokumenty w formatach PDF, DOCX, XLSX i PPTX, a także umożliwiał współdzielenie plików i wspólną pracę na nich. 

 

Prowadzone testy polegały na bieżącym użytkowaniu programu, a w połowie stycznia 2025 r. Biuro ds. Nauki i Rankingów pod kierownictwem Anny Zakrzewskiej rozpoczęło zbieranie opiniiodnośnie do przydatności narzędzia w portfolio aplikacji dostępnych dla kadry UAM. 

 

System jest rozwijany przez firmę Laniqo, razem z inwestorem, PONS Langenscheidt, a pracę nad jego rozwojem prowadzi 12 osób. Jak zapewniają twórcy aplikacji, podstawową jej zaletą jest bezpieczeństwo. Przykładowo dane wprowadzane w oknach tłumaczeń oraz korekty nie są zapisywane na serwerze, tłumaczone dokumenty są usuwane z serwera w momencie, gdy skasuje je użytkownik; oprócz użytkownika nikt nie ma dostępu do danych, a usuwanie jest trwałe i nie ma możliwości jego cofnięcia. Dodatkowo nie są wykorzystywane do trenowania modeli czy tworzenia glosariuszy. Słowem, dane są poufne i bezpieczne. 

 

Po uruchomieniu wersji produkcyjnej zespół Laniqo będzie przeprowadzał wywiady w celu określenia kierunków rozwoju produktu, tak aby spełniał on nasze oczekiwania. 

 

*** 

Poniżej zawarliśmy odpowiedzi na pytania, które pojawiały się w trakcie testowania programu: 

  • System tłumaczy kontekstowo akapit po akapicie – przez co nie posiada pamięci tłumaczeń, ponieważ dopasowania pełnych akapitów byłyby rzadkie; 

  • System został wytrenowany na danych ogólnodostępnych, pochodzących z bezpiecznych źródeł, filtrowanych pod względem jakościowym; 

  • Wolumeny danych do treningów liczone są w terabajtach, np. liczba zdań dla pary DE-EN to ponad 1 miliard; 

  • Tłumaczenie medyczne zostało stworzone przy pomocy danych pochodzących z artykułów naukowych i baz danych na otwartej licencji; 

  • Zespół z Wydziału Matematyki i Informatyki UAM zbudował prototyp i wygrał zawody w tłumaczeniu w Abu Dhabi 2022 r., pokonując wszystkich potentatów na rynku; 

  • W przeciwieństwie do tych stworzonych przez konkurencję, system używa stosunkowo małych modeli LLM, co zapewnia efektywność energetyczną i pozwala na uruchomienie go w organizacji z ograniczonymi zasobami sprzętowymi. 

 

 

Nauka Ogólnouniwersyteckie

Ten serwis używa plików "cookies" zgodnie z polityką prywatności UAM.

Brak zmiany ustawień przeglądarki oznacza jej akceptację.