Videnudvinding

Den udvinding af viden er den viden skabelsesprocessen fra strukturerede data ( relationelle databaser , XML ) og ustrukturerede (tekst, dokumenter, billeder). Outputtet skal være i et format, der kan læses af computere.

RDB2RDF W3C-gruppen er i gang med at standardisere et sprog til videnekstraktion i RDF- format fra databaser.

På fransk taler vi om "videnekstraktion fra data" (ECD).

Beskrivelse

Videnudvindingen finder sted i flere faser, før selve "  data mining  " ( Data Mining ).

Forbehandling består i at opbygge specifikke datakorporaer og formaterer dataene efter deres type (tekster, billeder, lyde osv.). Der følger en fase med datarensning og behandling af manglende data.

Værktøjer

Bibliografi

Se også

Noter og referencer

  1. https://www.w3.org/2001/sw/rdb2rdf/
  2. https://www.cairn.info/revue-francaise-de-gestion-2003-5-page-59.htm
  3. "  Videnudvinding fra data (ECD)  " , på ingenieur.fr ,10. november 2002(adgang til 17. august 2020 ) .

eksterne links