Išplėstinė paieška
 
 
 
Pradžia>Informatika>Natūralios kalbos apdorojimas (Natural language processing)
   
   
   
naudingas 0 / nenaudingas 0

Natūralios kalbos apdorojimas (Natural language processing)

  
 
 
1234567
Aprašymas

Mašina vertėja (Machine translation). "Amalgam". Duomenų bazės prieiga (Database Access). Informacijos paieška (Information retrieval). Teksto klasifikavimas (Text categorization). Iškleisti informaciją iš teksto (extracting data from text).

Ištrauka

Ankstyvuose 1960 metais buvo didele viltis, kad kompiuteriai galės versti iš vienos kalbos į kitą, kai tik Tiuringo projektas "vertė" koduotus pranešimus į suprantama vokiečių kalbą. Tačiau 1966 metais, buvo aišku, kad vertimas reikalauja supratingumo reikšmės pranešimo, kur kodas trūkumiškai priklauso nuo pranešimo sintaksės.

Nors tuo metu nebuvo pagrindinio lūžio mašinų vertime, tačiau buvo šioks toks progresas, nuo to atskaitos taško, kai dabar daugybe mašinų vertimo sistemos kiekviena diena yra naudojamos, jos sutaupo daug lėšų už rankinį būdą. Vienas iš didžiausių pasisekimų buvo TAUM-METEO sistema, kūrėjas Monrealio universitetas, kuri verčia orų prognozę iš anglų kalbos į prancūzų. Ši sistema veikė, nes šio valstybinio orų prognozės pranešimai buvo labai stilizuoti ir pastovūs.

Kuo daugiau atvirų sferų, tuo rezultatas blogesnis. Tipiška sistema yra SPANAM, kuri gali versti ispaniškus fragmentus teksto į anglų kalbą. Teksto tema susijusi su sveikatos paslaugomis.

Kita galimybe yra investuoti į žmogaus pastangas prieš redagavimo originalaus dokumento. Jei originalus dokumentas gali būti sukurtas suderintai su ribotu poaibiu anglų kalbos, tuomet tai galima kartais išversti, be reikalingumo prieš redagavimo darymo. Šis būdas yra ypač efektyvus, kai yra reikalingumas viena dokumentą išversti į daugumą kalbų, kaip tai yra atvejąs, teisinius dokumentus Europos Sąjungai, arba kompanijoms, kurios parduoda tuos pačius produktus tarptautiniu mastu. Apribota kalba kai kur yra vadinama "Caterpillar English" , todėl, kad "Caterpillar" buvo pirma kompanija, bandant parašyti savo taisykles į šias formas. Pirmas tikras pasisekimas šia kryptimi pavyko XEROX. Jie apibrėžė kalbą priežiūrai savo žinynų, kur pakankamai užteko, kad būtų galima išversti SYSTRAN sistemai į kalbas, su kuriomis XEROX dirbo.

Yra esminis startinis reikalavimas kiekvienai mašinai vertėjai, kad pasiektų aišku lygį, vertimo sistema turi turėti leksikono nuo 20000 iki 100000 žodžių ir gramatikos nuo 100 iki 10000 taisyklių, skaičiai gali variuoti įvairiai, priklausomai nuo pasirinkto formalizmo. Vertimas yra sudėtingas, nes bendru atveju, tai reikalauja nuodugnaus supratingumo teksto, ir reikalauja gilaus supratingumo situacijos, kurioje yra bendraujama, netgi vienas žodis gali turėti keletą reikšmių.

Kad vertimas būtų geras, vertėjas (žmogus ar mašina) turi skaityti originalų tekstą, suprasti situaciją, kuria remtis reikia, ir rasti situaciją esamam tekste pasirinktoje kalboje, kurioje gerai aprašyta panaši situacija.
Paskutiniais tyrimais, mašinų vertėjų konstravimas fokusavosi į duomenų valdymo sistemas. Tokia sistema pati save gali pritaikyti, išmokti vertimų iš terminologijos ir netgi stilistinių žodžių junginių, iš anksto jau išversto teksto. Tokia Microsoft tyrimų sistema yra pritaikyta versti Microsoft technikine medžiagą tiesiogiai automatiniu būdu šimtus ir tūkstančius sakinių iš Microsoft produktų dokumentacijos, kartu su derinimu vertimo. Šis pritaikytas procesas gali būti baigtas per vieną naktį, rezultatas su sistema, kuri gali atlikti darbą per vieną naktį, palyginus su ankščiau naudota žmogaus pritaikymu (kuris apimdavo mėnesius), yra akivaizdus vien tik materialinių kaštų sumažinimo atžvilgiu.

Microsoft tyrimų sukurta mašina vertėja (Machine Translation): ...

Rašto darbo duomenys
Tinklalapyje paskelbta2005-10-26
DalykasInformatikos referatas
KategorijaInformatika
TipasReferatai
Apimtis5 puslapiai 
Literatūros šaltiniai0
Dydis432.77 KB
AutoriusEdvinas
Viso autoriaus darbų1 darbas
Metai2004 m
Klasė/kursas4
Švietimo institucijaŠiaulių Universitetas
Failo pavadinimasMicrosoft Word Naturalios kalbos apdorojimas (Natural language processing) [speros.lt].doc
 

Panašūs darbai

Komentarai

Komentuoti

 

 
[El. paštas nebus skelbiamas]

 
 
  • Referatai
  • 5 puslapiai 
  • Šiaulių Universitetas / 4 Klasė/kursas
  • 2004 m
Ar šis darbas buvo naudingas?
Taip
Ne
0
0
Pasidalink su draugais
Pranešk apie klaidą