Išplėstinė paieška
 
 
 
Pradžia>Informatika>Erdvinių duomenų apdorojimas, sritys ir operacijos
   
   
   
naudingas 0 / nenaudingas 0

Erdvinių duomenų apdorojimas, sritys ir operacijos

  
 
 
123456789101112
Aprašymas

Įžanga. Tinklelio failai. Pagrindinės operacijos. Tinklelio failų taikymas erdvinių sričių apdorojimui. R medžiai. Taškai ir erdvinės sritys. Užklausos. Įterpimo ir trynimo operacijos. Vientisumo kontrolė. Apibendrinti paieškos medžiai. Artimiausio kaimyno paieška aukštesnės dimensijos duomenyse. Santrauka.

Ištrauka

Dažnai duomenų bazės naudojamos erdviniams duomenims tvarkyti. Tokiems duomenims apdoroti reikia specialių technologijų ir metodų. Be indeksų, paremtų erdvinių duomenų Z-tvarkos indeksavimu, keturkampių sričių indeksų, optimizuojančių erdvinių užklausų vykdymą, ir erdvinių duomenų tvarkymą, siūlomi ir tinklelio failai bei R-medžio tipo indeksai. Apie pastaruosius indeksvaimo metodus plačiau šiame referate. Taip pat bus užsiminta apie apibendrintų medžių indeksus bei duomenų vientisumo kontrolę, kai indeksavimui naudojami R medžiai. Pastebėsime keletą sunkumų, atsiradusių vykdant artimiausio kaimyno užklausas, kai apdorojami erdviniai duomenys.

Tinklelio failai (grid file) padalina duomenų erdvę į ortogonalų tinklą. Tinklelis k-dimensijos duomenų erdvėje apibrėžiamas k vektorių, vadinamų skale (linear scale). Yra vienareikšmis sąryšis tarp tinklelio, apibrėžto skalėje ir k dimesijos masyvo, vadinamo tinklelio direktorija (grid directory), elementų. Šio masyvo elementas turi nuorodą į disko bloką, vadinamą duomenų puslapiu (data page). Duomenų puslapis turi duomenų taškus, esančius atitinkamoje tinklelio ląstelėje. Metodas sudarytas taip, kad į bet kokią užklausą (point query),t.y. užklausa, kuri grąžina informaciją, susijusią su užklausos tašku, galima butų atsakyti daugiausia du kartus kreipiantis į diską. Tinklelio failai identifikuojant duomenų puslapį, kuriame yra ieškomas taškas, naudojasi tinklelio direktorija. Ieškant taško, pirmiausia randame atitinkamas nuorodas tinklelio direktorijoje. Tinklelio direktorijos nuoroda, identifikuoja puslapį, kuriame saugomas ieškomas taškas, jei jis apskritai yra duomenų bazėje.
Paaiškinsime tinklelio failo struktūrą dvimačiams duomenims. Metodas gali būti apibendrintas bet kokiai duomenų dimensijai, tačiau siekiant paprastumo apsiribosime dvimačiais duomenimis. Tinklelio failas linijomis, lygiagrečiomis ašims, padalina erdve į keturkampes sritis. Nors galima apibrėžti tinklelio failą nurodant taškus, kuriuose padalinama kiekviena ašis. Jei X ašis padalinama į i segmentų, o Y ašis j segmentų, viso yra i*j dalių. Tinklelio direktorija yra i*j masyvas su viena nuoroda blokui. Kiekviena ašis turi po skalę.

1 paveikslėlis parodo, kaip ieškome taško, naudojant tinklelio failo indeksą. Pirmiausia naudojama skalė (linear scale) kad galima butų rasti X segmentą, kuriam priklauso ieškomo taško X reikšme, paskui Y segmentą, kuriam priklauso Y reikšme. Tai identifikuoja nuorodą duotam taškui tinklelio direktorijoje. Tariame, kad visos skalės yra saugomos pagrindinėje atmintyje, todėl šis žingsnis nereikalauja kreipimosi į diską. Toliau, einama kur nurodo tinklelio direktorijos nuoroda. Kadangi tinklelio direktorija gali būti per didele, kad tilptų pagrindinėje direktorijoje, ji saugoma diske. Bet kokiu atveju, galima identifikuoti disko puslapį, kuriame yra duota nuoroda ir nueiti į jį per vieną kreipimąsį į diską, nes tinklelio direktorijos nuorodos yra surūšiuotos pagal eilutes ar stulpelius. Tinklelio direktorijos nuoroda duoda duomenų puslapio, kuriame yra ieškomas taškas, identifikacijos numerį ir šis taškas dabar gali būti pasiektas per viena kreipimąsi į diską. Taigi, galima pasiekti tašką per du kreipimusis į diską: vieną dėl direktorijos nuorodos, kitą - duomenų puslapio.
Atstumo užklausos (range quey)ir artimiausio kaimyno (nearest neighbor) užklausos lengvai atsakomos naudojant tinklelio failą. Atstumo užklausoms, naudojama skalė, kad galima būtų identifikuoti rinkinį tinklelio direktorijos nuorodų. Artimiausio kaimyno užklausoms, pirmiausia randama tinklelio direktorijos nuoroda duotam taškui ir ieškoma duomenų puslapio, į kurį ji nurodo. Jei duomenų puslapis tuščias, naudojame skalęč kad gautume duomenų nuorodą į tinklelio dalį, kuri yra gretima daliai, kuriai priklauso užklausos taškas. Mes gauname visus duomenų taškus, šiose dalyse ir tikriname juos visus, ieškodami artimiausio duotam taškui.
Tinkelio failas remiasi savybe, kad tinklelio direktorijos nuorodos nurodo į puslapį, kuriame yra ieškomas duomenų taškas (jei toks taškas yra duomenų bazėje). Tai reiškia, kad mes priversti padalinti tinklelio direktoriją (o taip pat ir skalę per dalinamą dimensiją), jei duomenų puslapis yra pilnas, o naujas taškas yra įterpiamas į tą puslapį. Siekiant pasiekti gerą erdvės panaudojimą, leidžiame kelioms tinklelio direktorijos nuorodoms nurodyti į tą patį puslapį. Tai yra, kelios dalys duomenų erdvės gali būti pažymėtos į tą patį fizinį puslapį, tuo tarpu, kai rinkinys taškų telpa į vienį puslapį. ...

Rašto darbo duomenys
Tinklalapyje paskelbta2006-10-31
DalykasInformatikos referatas
KategorijaInformatika
TipasReferatai
Apimtis10 puslapių 
Literatūros šaltiniai9
Dydis116.34 KB
AutoriusOlga
Viso autoriaus darbų120 darbų
Metai2006 m
Klasė/kursas2
Švietimo institucijaVilniaus kolegija
Failo pavadinimasMicrosoft Word Erdviniu duomenu apdorojimas sritys ir operacijos [speros.lt].doc
 

Komentarai

Komentuoti

 

 
[El. paštas nebus skelbiamas]

 
 
  • Referatai
  • 10 puslapių 
  • Vilniaus kolegija / 2 Klasė/kursas
  • 2006 m
Ar šis darbas buvo naudingas?
Taip
Ne
0
0
Pasidalink su draugais
Pranešk apie klaidą