Samtidig forekomst

Den co-forekomst (uden bindestreg på fransk) er den samtidige tilstedeværelse af to eller flere ord eller andre sproglige enheder i den samme sætning, for eksempel, sætning, afsnit, ekstrakt.

Discipliner som historie eller geografi er også interesseret i samtidig forekomst af ord eller stednavne i tid og rum.

Et beslægtet begreb er "  kollokation ", som er en form for idiomatisk udtryk forårsaget af systematisk co-forekomst.

Definition af elementer

Ordet co-forekomst kan have flere betydninger.

Ordene "co-forekomster" er ikke nødvendigvis forbundet med formelle eller syntaktiske relationer (faste syntagmer, udtryk, kollokationer ), ved synonym , antonym eller ansigt ( hyperonymi eller meronymi ), men har alligevel nødvendigvis noget sprogligt link.

Når de to ord - eller andre sproglige enheder - har et tæt eller fjernt semantisk forhold , er begrebet co-forekomst grundlaget for det tematiske, leksikale felt eller isotopi .

Problemer, anvendelser

Denne opfattelse bruges i så forskellige områder som

Påvisning, tekstanalyse

Når de to ord - eller andre sproglige enheder - har et tæt eller fjernt semantisk forhold , er begrebet co-forekomst grundlaget for det tematiske, leksikale felt eller isotopi .

Den analyse af tekstdata insisterer på de statistiske sammenhænge , at de to co-forekomster skal vedligeholde, og har foreslået en lang række spor til korrekt beregning af tiltrækning observeret. Co-forekomst bliver derefter den statistisk signifikante co-tilstedeværelse af to eller flere enheder i det samme pop op-vindue.

Software til automatisk detektion af idiomer og andre co-forekomster findes; de er leksikometrisk, tekstometrisk og logometrisk software, der tilbyder adskillige repræsentationer af samforekomster i mærket tekstlig korpus eller enkle tekster (de udtrækker samforekomster i form af enkle lister, grafer, netværk eller netværk ) Blandt disse software er for eksempel:

etc.

Forskning

Forskere forsøger bedre at definere dette koncept og dets udfordringer i henhold til anvendelsesområderne (nøjagtig, human- og samfundsvidenskab) og dets vurderingsskala (rumlig, tidsmæssig, abstrakt). De søger også at udvikle metoder til bedre at vurdere co-forekomst kvalitativt og bedre måle det kvantitativt.

Eksempler på sammenfaldende ord

Noter og referencer

  1. Matthias Tauveron (2012) Fra generaliseret co-forekomst til variation i leksikalsk betydning , i Co-forekomst, fra statistisk fakta til tekstfakta, (Damon Mayaffre og Jean-Marie Viprey, red.), CORPUS, 11, 2012
  2. Manning C., Schütze H (1999) Fundament for statistisk naturlig sprogbehandling , Cambridge (Mass.); London: MIT Press
  3. Foltête Jean-Christophe (2003) Rekonstruktion af en rumlig diffusion fra en række stater ; Geographic space, 2003/2 (bind 32), s.  171–183
  4. Salazar-orvig Anne, diskursens bevægelser. Stil, reference og dialog i kliniske interviews , Paris, L'Harmattan, 1999, 294 s.
  5. Xu, J., & Croft, WB (1998) Corpusbaseret stamme ved anvendelse af sammenfald af ordvarianter . ACM-transaktioner på informationssystemer (TOIS), 16 (1), 61-81.
  6. Veyne Paul (1971) Hvordan man skriver historie. Epistemologisk essay Paris, Ed. Du Seuil 352 sider.
  7. Pisetta Vincent, Hacid Hakim, Bellal Fazia, Ritschard Gilbert og A. Zighed Djamel (2006) Automatisk behandling af juridiske tekster i R. Lehn, M. Harzallah, N. Aussenac-Gilles, J. Charlet (red.), Uger af viden , SdC 2006, Nantes 26.-30. juni (Digital procedure på Cd-Rom)
  8. Matthias Tauveron (2012) Fra generaliseret co-forekomst til variation i leksikalsk betydning, i Co-forekomst, fra statistisk fakta til tekstfakta, (Damon Mayaffre og Jean-Marie Viprey, eds), CORPUS, 11, 2012
  9. Moalla Koubaa Ikram (2009) Karakterisering af middelalderlige skrifter ved hjælp af statistiske metoder baseret på medforekomster . Speciale inden for datalogi, INSA Lyon.
  10. Moscovici Serge og Henry Paul (1968) Problemer med indholdsanalyse (, Sprog, socio-lingvistik, bind 3, nr .  11, s.  36-60
  11. Schütze, H., & Pedersen, JO (1997) En sammenhængsbaseret tesaurus og to applikationer til informationssøgning . Information Processing & Management, 33 (3), 307-318.
  12. Matsuo, Y., og Ishizuka, M. (2004). Nøgleordsekstraktion fra et enkelt dokument ved hjælp af statistisk information om ordsamfundet International Journal on Artificial Intelligence Tools, 13 (01), 157-169.
  13. Globerson Amir, Chechik Gal, Pereira fernando, Naftali Tishby (2007) euklidisk Indlejring af Co-forekomst data , Tidende Machine Learning Research 8 (2007), s.  2265-2295
  14. Manning C., Schütze H. (1999) Fundament for statistisk naturlig sprogbehandling , Cambridge (Mass.); London: MIT Press
  15. Prévost Marie & Debruille Jacques Bruno (2013) Samtidig forekomst af religiøse, overtroiske og vildfarne overbevisninger , Santé Mental au Québec, bind 38, nummer 1, forår 2013, s.  279-296
  16. "  Alceste-software  " , på www.image-zafar.com (adgang til 18. august 2016 )
  17. Josselin D (2014) Meddelelse om det tværfaglige seminar “ Cooccurrences & co. ”(Avignon 5. december 2014), offentliggjort oktober 2014

Se også

Relaterede artikler

Lignende forestillinger

Afhængigt af feltet er denne forestilling mere eller mindre ens eller knyttet til lignende forestillinger, herunder f.eks

Bibliografi