Hvordan virker det? | maskinoversættelse

For første gang tanken om at bruge elektroniske computere for ord oversættelse blev lavet i 1947 i USA, umiddelbart efter fremkomsten af ​​de første computere. Den første offentlige demonstration af en maskinoversættelse fandt sted i 1954. Dette system var meget primitive: hun havde et ordforråd på kun 250 ord, 6 grammatiske regler og kunne oversætte nogle få enkle sætninger. Men eksperimentet har fået et bredt svar: forskning begyndte i lande rundt om i verden, herunder Sovjetunionen. Hvordan fungerer det moderne maskinoversættelsessystem - om det i dagens udgave!

Hvordan virker det? | maskinoversættelse Hvordan virker det? | maskinoversættelse

Grundlaget for moderne systemer er oversættelsen algoritme, der anvender formelle grammatik og sproglige statistik. At lære et sprog, systemet sammenligner tusindvis af parallelle tekster - der indeholder de samme oplysninger, men på forskellige sprog. For hver undersøgelse teksten systemet bygger en liste over unikke funktioner. For eksempel sjældent brugt ord og specielle tegn, der vises i teksten med en vis frekvens.

Hvordan virker det? | maskinoversættelse

I maskinoversættelsessystemer er normalt tre hoveddele: en oversættelse model, sprog model og en dekoder. Oversættelse model - denne tabel, at der for alle de ord og sætninger i et sprog er den mulige oversættelse til et andet sprog, som indebærer sandsynlighed for disse oversættelser. Systemet sammenligner ikke kun adskilte ord, men også sætninger af flere ord, i træk. oversættelse modeller for hvert par af sprog indeholder millioner af par af ord og sætninger. Med hensyn til sprog-modellen, er det skabt af systemet på tidspunktet for at studere teksterne. Overførsel tager dekoder. Han tilbringer det morfologiske og syntaktiske analyse af teksten og for hver sætning markerer alle oversættelser faldende rækkefølge af sandsynlighed. Så alle de opnåede varianter dekoder estimater bruge sproget model til at bruge frekvens og vælger det bud med den bedste kombination af sandsynligheden og frekvens.

Hvordan virker det? | maskinoversættelse

maskinoversættelsessystemer kan bruges ikke kun til tekstbehandling, men også for oversættelse af enkelte ord. De indeholder en komplet ordbog med detaljerede kort af ord og udtryk. Dette kort er baseret på statistiske oplysninger, der er baseret på reglerne i sproget. Til maskine ordforråd vælger hun kun ordbog former for ord og faste udtryk. Systemet udfører en morfologisk og syntaktisk analyse, bestemmer ordklasse, ordbogen form af ord og sætninger sætte grænser. Disse oplysninger hjælper frasortere ufuldstændige sætninger. For at undgå fejl ved en algoritme baseret på maskine learning teknologi, kontrollerer alle potentielle par overførsler og fjerner upålidelige.

Luk i værdi overførsler er grupperet system ved hjælp af ordbøger af synonymer. De får ord, der ofte oversættes til et andet sprog eller danner den samme sætning med de samme ord. Som et resultat, indfødte ordforråd får alt, hvad han har brug for at vide om hvert ord og udtryk: dens ordbog form ordklasse, betydninger og synonymer. Nogle systemer, for klarhed, der sættes til oversættelse eksempler er taget fra parallelle tekster.

Hvordan virker det? | maskinoversættelse

Brugen af ​​statistiske data gør det muligt at ændre maskinoversættelsessystem sammen med sproget. Hvis folk begynder at skrive et ord på en anden måde, at systemet ser det, så snart den træder nye tekster. For at forbedre kvaliteten af ​​oversættelsen, er systemet opdateres regelmæssigt og foretage inspektioner. Men høj kvalitet maskinoversættelse af tekster er stadig uopnåelig. Men det i høj grad forenkler og fremskynder arbejdet med oversættere.