Hyperbase

Hyperbase er et universitetssoftware til dokumentarisk og statistisk udforskning af tekster. Det distribueres af CNRS og Université Côte d'Azur og er designet og udviklet af Étienne Brunet og Laurent Vanni inden for UMR Bases, Corpus, Langage. Mellem sin fødsel i 1989 og den sidste version 10 i 2021 har Hyperbase løbende implementeret fransk leksikometrisk know-how med hensyn til tekststatistik og dokumentarundersøgelse af store korpus; i dag er den åben for dyb læring og kunstig intelligens. Softwaren bruges hovedsageligt til specialer og arbejder inden for lingvistik, litteratur, historie, sociologi eller statskundskab.

Historisk

Den første version af Hyperbase-softwaren stammer fra 1989. Efter tyve års erfaring på forskellige sprog på store systemer vendte Étienne Brunet sig til mikrocomputere og skabte i anledning af den franske revolutions toårsdag i Center Georges-Pompidou, en mikroinstallationssoftware til tekstanalyse. Først udviklet på Mac med Hypercard, blomstrede Hyperbase fra slutningen af 1990'erne på Windows. I 2000'erne blev Hyperbase knyttet til TreeTagger eller Cordial lemmatizers / labelere og gik således ud over den blotte statistiske behandling af grafiske ord ved kombineret behandling af formularer, lemmaer, grammatiske koder eller syntaktiske sekvenser. I 2010 handler Hyperbase sammen med fransk og latin, de største europæiske sprog (engelsk, spansk, tysk, italiensk, portugisisk). I 2017 blev Hyperbase på den ene side udviklet under en 10.0- desktopversion, der tilbyder flere nye funktioner, herunder dybtgående behandling af co - forekomster , datasammenligning med GoogleBooks (70 milliarder ord) og bedre koordinering med partnersoftware som Iramuteq. eller Gephi og på den anden side under en webversion. I 2020 vil webversionen af ​​softwaren, udviklet af Laurent Vanni, være udstyret med dyb læring, læring, tekstforudsigelse og beskrivelsesfunktioner.


Funktioner

Hyperbase kombinerer to typer funktioner, dokumentariske og statistiske, som gør det muligt for analytikeren at beskrive, karakterisere, klassificere og fortolke tekster.

brug

Hyperbase bruges i flere discipliner inden for humaniora og samfundsvidenskab, der beskæftiger sig med beskrivelse og fortolkning af tekster (litterære værker, historiske arkiver, politiske taler, spørgeskemaer og sociologiske interviews). Hyperbase gør det muligt at etablere endogene kronologier i sociohistoriske korporaer, lave typologier af forfattere i litterære korporaer eller karakterisere genrer i sproglige korporaer. Softwaren bruges især til at opdage temaer eller isotopier af taler, især takket være beregningen af ​​de leksikale universer i en ordpol eller den generelle behandling af medforekomster .

Softwaren præsenteres som et heuristisk værktøj, der gør det muligt takket være artikulationen af ​​den kvantitative (tekststatistik) og den kvalitative (assisterede og systematiske tilbagevenden til teksten) at ernære og kontrollere den fortolkende handling ved humanioraens fundament.

Konfigureret ad hoc-måde tillader det online-analyse af visse korpusser som "Observatoriet for den franske præsidentdiskurs (1958-2014)", Balzac-basen (hypertekstuel forskning i den menneskelige komedie ), Rabelais eller halvtreds af mest store forfattere af fransk litteratur (du Bellay, Racine, Hugo, Sand, Rimbaud, Aragon, Le Clézio osv.).

Se også

Bibliografi

Hvor er nogle akademiske værker opført, der baserer deres analyser på softwaren Hyperbase eller forklarer dens funktion og dens videnskabelige fordele.

Arbejder

Specialer og universitetsarbejde

Artikler

Noter og referencer

  1. https://bcl.cnrs.fr/
  2. Se bibliografi. For eksempel: Marion Bendinelli, Study of modal and semi-modal auxiliaries in American presidential debates (1960-2008): kvalitative og kvantitative analyser. Indflydelsesrelationer og magtspørgsmål (dir. S. Mellet, 2012, Nice)
  3. Se bibliografi. For eksempel: Véronique Magri-Mourgues, Le Voyage à pas tæller. For poetik af rejseskildringen i det 19. århundrede , Champion, 2009
  4. Se bibliografi. For eksempel: Magali Guaresi, Parler au feminine. Trosyrkerne for deputerede under den femte republik (1958-2007) (dir. D. Mayaffre og co-dir. J.-P. Pellegrinetti, 2015, Nice)
  5. Se bibliografi. For eksempel: Damon Mayaffre , Mål og overdreven diskurs. Nicolas Sarkozy 2007-2012 , Presses de SciencesPo, 2012
  6. http://hyperbase.unice.fr//
  7. http://mesure-du-discours.unice.fr//
  8. http://ancilla.unice.fr/~brunet/BALZAC/balzac.htm
  9. http://ancilla.unice.fr/rabelais.html
  10. http://logometrie.unice.fr/pages/bases//