Bine aţi venit pe Scientia QA!
Pentru a putea publica întrebări şi răspunsuri, trebuie să vă înregistraţi.
Atenţie! Este posibil ca e-mailul de confirmare a înregistrării să intre în Spam.
  • Inregistrare
Pune o întrebare

Newsletter


3.5k intrebari

6.7k raspunsuri

15.2k comentarii

2.2k utilizatori

1 plus 0 minusuri
538 vizualizari
Aveti cunostinta despre softuri de acest gen si care sa dea rezultate bune? Nu neaparat in/din limba romana sau engleza, ci intre oricare doua limbi. Ma gandesc ca intre anumite limbi, cu gramatici si lexic apropiate, un asemenea proces computerizat ar putea fi totusi implementat cu succes...
a intrebat Senior (7k puncte) in categoria Diverse

3 Raspunsuri

2 plusuri 0 minusuri
 
Cel mai bun raspuns
Traducerea automată, ca să fie bună, trebuie să realizeze două operații: înțelegerea originalului din limba sursă și exprimarea lui în limba destinație. Ambele operații sînt de fapt foarte complexe, chiar dacă mintea omului pare să le facă ușor. Cercetările pentru traducerea automată au început acum circa 60 de ani, iar rezultatul obținut azi e așa prost cum îl știți din cauza acestei complexități, mai exact din cauza scurtăturilor pe care lingviștii și programatorii trebuie să le facă pentru a reduce din complexitate.

În funcție de gradul de înrudire dintre cele două limbi scurtătura poate fi mai scurtă sau mai lungă, iar rezultatele sînt pe măsură. De exemplu traducerea între italiană și spaniolă se face cu un succes relativ mare (de vreo 90%, scrie undeva, deși nu știu cum a fost măsurat). În astfel de cazuri traducerea se reduce în mare măsură la păstrarea sintaxei și doar înlocuirea cuvintelor, după ce s-a detectat morfologia lor din limba sursă și s-au transpus aceleași informații (număr, persoană, timp etc.) în morfologia cuvintelor din limba destinație.

Pentru alte perechi de limbi, mai ales din cele neînrudite și cu structură gramaticală foarte diferită (de exemplu engleza și japoneza) astfel de scurtături nu mai funcționează. Softul trebuie să „înțeleagă” într-o măsură mai mare originalul, adică să traducă mai întîi într-un fel de limbă universală, simbolică, și apoi să exprime aceleași informații în limba destinație. Procesul e foarte greoi, iar rezultatele se văd.

Google Translate și alte programe folosesc un principiu statistic: se uită la o bază de date compusă dintr-o masă imensă de texte bilingve (traduceri de romane, texte legislative internaționale etc.) și aplică procedee matematice pentru a face traducerea. Există și alte principii de traducere automată, fiecare cu avantajele și dezavantajele lui. Dacă metoda statistică are nevoie doar de cantități mari de text deja tradus, alte metode au nevoie, de exemplu, de alcătuirea unor seturi de reguli foarte amănunțite privind gramatica celor două limbi implicate, proces care e foarte anevoios.

Softurile de cumpărat nu sînt nici ele mai breze la partea de traducere (au avantaje la interfața cu utilizatorul). Deci problema e că tehnologia curentă încă nu e destul de performantă. În ultimii 10-15 ani s-au făcut progrese destul de rapide, deci dacă e să extrapolăm e de așteptat că vom vedea în curînd softuri mai bune decît cele de azi.

Este totuși posibil ca traducerile foarte bune, pe picior de egalitate cu ale traducătorilor profesioniști, să nu apară prea curînd. Asta pentru că traducătorii umani țin cont de realitățile culturale ale societăților unde se vorbesc cele două limbi, observă și transmit finețuri semantice, explică aluziile sau referințele cînd nu le pot traduce, adaptează jocurile de cuvinte, traduc versurile în versuri etc. Deocamdată e prea devreme să cerem toate astea unui soft.
a raspuns Expert (12.7k puncte)
selectat de
0 0
Multumesc pentru raspunsul detaliat. De unde aveti cifra cu privire la traducerile automatizate italiana-spaniola? Stiti cumva si despre ce software e vorba?
0 0
cu alte cuvinte problema nu este in traducere ci in interpretare. Multe soft-uri iti traduc perfect toate cuvintele dintr-o limba in alta dar nu sunt in stare sa interpreteze o propozitie simpla, astfel incat sa "sune" natural in limba in care a tradus. De aici si termenii "interpret" in loc de traducator, sau "traducerea si adaptarea".
1 0
Goguv, cifra o am din memorie, dar o văd menționată în Wikipedia la articolul „Transfer-based machine translation” (nu scrie însă care e perechea de limbi). Nu știu despre ce soft e vorba. În orice caz, performanțele softurilor care se bazează pe aceeași metodă de traducere sînt de obicei foarte apropiate.

Thev1russ, folosiți termenii greșit. Traducerea include și formularea naturală în limba destinație. Iar interpretul e altceva: e cel care face traducerea oral și pe loc (simultan sau consecutiv, dar oricum pe loc, adică pe măsură ce se derulează conversația sau expunerea). Formula „traducere și adaptare” e de fapt un pleonasm, pentru că traducerea include inevitabil și adaptarea.

Și nu, softurile nu pot traduce perfect toate cuvintele. Asta e una din multele dificultăți ale traducerii automate, și anume polisemia și omonimia cuvintelor, adică faptul că aceeași formă scrisă poate să însemne lucruri complet diferite (ca „toc”: de ușă, de ochelari, de scris) sau să aibă sensuri înrudite și totuși diferite (ca „fir”: electric, de cusut) în funcție de context, iar softurile de traducere sînt foarte slabe la a înțelege contextul. În plus același cuvînt scris poate fi ambiguu și în categoriile sale gramaticale; de exemplu „nume” poate fi singular sau plural, „verde” poate fi masculin sau feminin, „intră” poate fi indicativ prezent (singular sau plural) sau perfect simplu sau imperativ.

Dacă spui „mi-a intrat o muscă în ochi” e vorba de un ochi, dacă spui „aveam lacrimi în ochi” e vorba de amîndoi ochii. Noi oamenii înțelegem asta instantaneu și ni se pare evident (cum ar putea să intre musca în ambii ochi?! Cum ai putea lăcrima cu un singur ochi?!), dar softul are nevoie de o înțelegere detaliată a logicii lumii în care trăim ca să deducă de cîți ochi e vorba și să traducă corect, de exemplu prin „eye” sau „eyes”.
0 0
exact la asta ma refer,un traducator automat complet iti va da toate definitiile unui cuvant dintr-o limba oarecare, dar nu va sti sa asocieze doua cuvinte intr-o propozitie ca sa "inteleaga" la ce se refera cel care a formulat-o. Este relativ simplu sa construiesti o baza de date cu toate cuvintele unei limbi, nu ai decat sa le aduni si sa le definesti pe toate cu toate intelesurile posibile (ca si DEX-ul nostru de exemplu), dar este foarte complex si dificil, dupa cum spuneai, sa le traduci in context.

"traducerea include inevitabil și adaptarea"  aici nu sunt de acord si exemplul cel mai clar il avem in softurile automate de traduere, care traduc dar nu adapteaza. Sunt sigur ca ai vazut subtitrari de exemplu care sunt traduse (probabil automat), dar nu si adaptate la scena respectiva a filmului.
1 plus 0 minusuri
1. Limbajul uman e "viu", adică se schimbă în timp şi are variaţii în "spaţiu", adică dialecte, argouri, jargoane şi limbaje de specialitate.

Totuşi, acestea se pot rezolva cu multă muncă, realizând variante specifice de traducere şi update-uri fracvente.

2. Limbajul uman conţine o structură intraductibilă numită "metaforă", unde cu ajutorul unor cuvinte cunoscute obţinem expresii cu un conţinut complet diferit şi uneori greu de explicat ori de tradus.

3. Limbajul uman are o componetă "emoţională" care nu este cuprinsă în cuvinte şi reiese din context. Acestă "emoţie" a textului nu poate fi tradusă mot-a-mot ci necesită o adaptare a textului, pe care nici-un soft nu o poate realiza ci numai un traducător uman.

În legătură cu acestă problemă îmi aduc aminte celebra scenă dintr-un film american dublat în franceză. Scena prezenta un duel în care unul dintre pistolari zice printre dinţi: "Hello, mister!" în traducere vocea francezului spune: "Bonjour, monsieur!"
a raspuns Junior (966 puncte)
0 plusuri 0 minusuri
Limbile umane sunt foarte imperfecte. Exista numeroase sinonime neologisme, flexiuni gramaticale, etc. Dictionarele ofera pana la cateva zeci de corespondente pentru acelasi cuvant. Cand trebuie facuta o traducere intre doua limbi imperfecte rezultatul este cu atat mai imperfect. Traducatorii profesionisti sunt buni numai in domeniul pe care il stapanesc bine: politica, cultura, medicina, stiinte exacte, etc. Cea mai dificila este traducerea simultana dintr-o limba oarecare in mai multe limbi (ONU, UE, etc.) cand sunt necesari foarte multi traducatori specializati in cate o pereche de limbi. Pentru a simplifica traducerea automata pentru un numar mare de limbi s-a propus crearea, numai pentru uzul programelor, a unei limbi artificiale perfecte prin intermediul careia sa se realizeze orice traducere. Oricum, problema traducerii nu va fi rezolvata niciodata, dar va putea fi ameliorata.
a raspuns Junior (817 puncte)

...