Business intelligence

Den BI (engelsk business intelligence ( BI ) og beslutning systemunderstøttelse ( DSS )) er den computer til brug for beslutningstagere og virksomhedsledere. Den udpeger de midler, værktøjer og metoder, der gør det muligt at indsamle, konsolidere, modellere og gendanne data , materielle eller immaterielle , for en virksomhed for at tilbyde beslutningsstøtte og give beslutningstagere mulighed for at få et overblik over den aktivitet, der er behandlet.

Denne type applikationer er baseret på en fælles arkitektur, hvis teoretiske baser hovedsageligt kommer fra Ralph Kimball , Bill Inmon og DanLinstedt.

  1. De data operationer udtages med mellemrum fra heterogene kilder: flade filer , filer Excel , database ( DB2 , Oracle , SQL Server , etc.), webtjeneste , massive data og gemt i et datawarehouse .
  2. Dataene omstruktureres, beriges, aggregeres, omformateres, kategoriseres for at blive præsenteret for brugeren i en semantisk form (forretningsvisninger med betydning), der gør det muligt for beslutningstagere at interagere med dataene uden at skulle kende deres fysiske lagringsstruktur af stjerneskemaer der kan sprede fakta og målinger som hierarkiske dimensioner, rapporter foruddefineret konfigurerbar til dashboards mere syntetiske og interaktive.
  3. Disse data leveres til de forskellige funktionelle områder (strategisk retning, økonomi, produktion, regnskab, menneskelige ressourcer osv.) Gennem et sikkerhedssystem eller specialiseret datamart med henblik på konsultation, analyse, foruddefinerede alarmer, ' data mining osv.

Business intelligence er en del af den bredere arkitektur i et informationssystem , men er ikke et konkurrerende koncept med informationssystemstyring . På samme måde som ledelse kommer under sociologi og økonomi , er ledelse gennem it konstituerende for to radikalt forskellige områder, som er ledelse og it . For at berige konceptet med disse to måder at tænke på, er det muligt at overveje en it-ingeniørorienteret side kaldet business intelligence , og en anden side, der betjener mere specifikt ledelsesmetoder kaldet system management information .

Definition

Det engelske udtryk business intelligence (BI) kan føre til forveksling med begrebet økonomisk intelligens (IE). Business intelligence betyder ikke "  økonomisk intelligens  ", i modsætning til hvad en bogstavelig oversættelse antyder (Jf. Denne diskussion) .

BI adskiller sig fra EI på tre måder:

Indsatser af business intelligence

I øjeblikket er forretningsapplikationsdata gemt i en (eller flere) relationel eller ikke-relationel database (r) .
Disse data ekstraheres, transformeres og indlæses i et datalager generelt af et ETL - værktøj ( Extract-Transform-Load ).

Et datalager kan have form af et datalager eller et datamarked . Som en generel regel, data warehouse samler alle de anvendelsesområder data i selskabet, mens de data marts (generelt fodret fra data fra data warehouse ) er delmængder af oplysninger om en bestemt virksomhed i selskabet (markedsføring, risiko, ledelsesmæssig kontrol, osv.), specifikke anvendelser (analyse, rapportering osv.) eller endda opfylde specifikke krav eller begrænsninger (partitionering af data, volumen osv.). Udtrykket data counter eller data butik bruges også til at betegne en datamart.

Datalager giver dig mulighed for at producere rapporter, der besvarer spørgsmålet "Hvad skete der?" Men de kan også designes til at besvare det analytiske spørgsmål "Hvorfor skete dette?" "Og til det prognostiske spørgsmål" Hvad vil der ske? ". I en operationel sammenhæng besvarer de også spørgsmålet "Hvad sker der lige nu?" ", Eller endda i tilfælde af en aktiv datalagerløsning" Hvad skal der ske? ".

Den rapporteringen er sandsynligvis den mest anvendte i dag, og BI ansøgning, det giver ledere:

Programmerne, der bruges til rapportering, gør det naturligvis muligt at gengive de samme valg og de samme behandlinger fra periode til periode og at variere visse kriterier for at forfine analysen. Men rapportering er ikke strengt taget en ansøgning om beslutningstøtte. Fremtiden tilhører snarere instrumentbræt - instrumenter udstyret med Olap-flerdimensionelle analysefunktioner. OLAP- funktion, som kan opnås på forskellige måder, for eksempel via en R-OLAP-relationsdatabase eller multidimensionel M-OLAP-database eller endda i H-OLAP.

Datamarts og / eller datalager kan således via OLAP muliggøre en meget dybdegående analyse af virksomhedens aktivitet takket være statistikker, der kombinerer oplysninger om aktiviteter, der tilsyneladende er meget forskellige eller meget fjerne fra hinanden, men undersøgelsen, der ofte afslører dysfunktioner , korrelationer eller muligheder for meget væsentlige forbedringer.

Den interoperabilitet mellem systemerne data warehouse , edb-applikationer eller content management , og rapporteringssystemer opnås gennem et management metadata .

Fra tavlen til hypercube

Business intelligence fokuserer på måling:

Bestyrelse

For eksempel vil vi måske måle:

Vi får således en tabel med to poster:

Som illustration gør krydstabellerne i de vigtigste regneark det muligt at opbygge denne type instrumentbræt fra en database .

Terning

Hvis vi er interesseret i en tredje analysedimension, for eksempel det geografiske hierarki af salgssteder (efter land, region, butik), flytter vi os således til en terning . De pivottabeller i Excel kan repræsentere denne type terning med "side", som repræsenterer den samlede data for hvert hierarkisk niveau og for hver dimension.

Hypercube

Hvis vi er interesseret i en yderligere analyseakse, for eksempel kundesegmentering (efter kategori, erhverv, kunde), får vi derefter en terning med mere end 3 dimensioner, kaldet hypercube . Udtrykket terning bruges ofte i stedet for hyperterning .

Navigation i en hyperkube

Værktøjerne i beslutningsverdenen giver mulighed for "navigation" i de forskellige dimensioner af terningen eller hyperterningen:

Forholdsregler at tage

Hver af disse delvisninger af terningen resulterer i sidste ende i enten en dobbeltindgangstabel (krydssortering) eller en generelt todimensionel graf .

Selvom navigationen i terningen er flerdimensionel, har beslutningstageren således i virkeligheden ikke adgang til en syntese, men til et væld af krydsorter eller todimensionelle synspunkter, hvis udforskning, lang og kedelig, undertiden er kort. - kredsløb for mangel på tid. Dette kan føre til dyre beslutningsfejl.

Det kan derfor være nyttigt at kombinere denne tilgang med en ikonografi af sammenhænge , der giver et ægte flerdimensionelt overblik uden afskedigelser.

Væsentlige funktioner i forretningsinformation

Et beslutningsinformationssystem (CIS) skal kunne levere fire grundlæggende funktioner: indsamling, integration, distribution og præsentation af data . Til disse fire funktioner tilføjes en administrationsfunktion , det vil sige styringen af ​​selve SID.

Saml funktion

Samlingen funktion (undertiden kaldet datapumping ) dækker alle de opgaver, der består i at detektere, udvælgelse, ekstraktion og filtrering rå data fra de relevante miljøer givet anvendelsesområde dækket af SID. Som det er almindeligt for interne og / eller eksterne data kilder at være heterogene - både teknisk og semantisk - denne funktion er den vanskeligste at etablere sig i en kompleks beslutningssystem. Den er især afhængig af ETL- værktøjer ( ekstrakt-transform-belastning til ekstraktion-transformation-belastning).

Den kilde data , der giver næring til SID kommer fra transaktions produktionssystemer, oftest i form af:

Samlingsfunktionen spiller også en omkodningsrolle, hvis det er nødvendigt. En data repræsenteret forskelligt fra én kilde til en anden kræver valget af en enkelt repræsentation og derfor et nyttigt egenkapital til fremtidig analyse.

Integrationsfunktion

Integrationsfunktionen består i at koncentrere de indsamlede data i et samlet rum, hvis væsentlige it-fundament er datalageret . Et centralt element i systemet, det giver business intelligence -applikationer for at skjule mangfoldigheden af oprindelsen af data og til gavn af et fælles, homogent, standardiseret og pålidelig kilde til information, inden for en enkelt og om muligt standardiseret system.

I forbifarten renses eller transformeres dataene ved:

Det er også i denne funktion, at beregningerne og sammenlægningerne (akkumuleringer), der er fælles for hele projektet, udføres.

Integrationsfunktionen leveres generelt af styringen af metadata , som sikrer interoperabilitet mellem alle computerressourcer , hvad enten det er strukturerede data ( databaser, der er adgang til via softwarepakker eller applikationer) eller ikke- data. Struktureret (dokumenter og andre ustrukturerede ressourcer, manipuleret af indholdsstyringssystemer ).

Broadcast-funktion (eller distribution)

Formidlingsfunktionen gør dataene tilgængelige for brugerne i henhold til mønstre svarende til hver enkelt profiler eller erhverv , velvidende at direkte adgang til datalageret generelt ikke svarer til de specifikke behov hos en beslutningstager eller leder. 'En analytiker. Det prioriterede mål er derfor at segmentere dataene i meget sammenhængende informationskontekster, nemme at bruge og svarer til en bestemt beslutningsaktivitet. Mens et datalager kan være vært for hundreder eller tusinder af variabler eller indikatorer, har en rimelig frigivelseskontekst højst kun et par dusin. Hver kontekst kan svare til et datamart , selvom der ikke er nogen generelle regler for fysisk lagring. Meget ofte er en diffusionskontekst flerdimensionel , det vil sige kan modelleres i form af en hypercube ; det kan derefter gøres tilgængeligt ved hjælp af et OLAP- værktøj .

De forskellige sammenhænge i det samme beslutningstagningssystem har ikke alle brug for det samme niveau af detaljer. Mange aggregater eller akkumuleringer er kun af interesse for bestemte applikationer og behøver derfor ikke at blive administreret som almindelige aggregater af integrationsfunktionen: Styringen af ​​denne type specificitet kan håndteres af udsendelsesfunktionen. Disse aggregater kan eventuelt opbevares vedvarende eller dynamisk beregnet efter behov.

På dette stadium, og når det drejer sig om at designe et rapporteringssystem, skal tre niveauer af spørgsmålstegn hæves:

Præsentationsfunktion

Denne fjerde funktion, den mest synlige for brugeren, styrer betingelserne for brugeradgang til information inden for rammerne af en bestemt menneskelig-maskine-grænseflade ( HMI ). Det giver adgangskontrol og drift af arbejdsstationen , håndtering af anmodninger, visning af resultater i en eller anden form. Det bruger alle mulige kommunikation teknikker: office værktøjer , requestere og specialiserede rapport generatorer, web -infrastruktur , mobil telekommunikation, osv

Administration funktion

Det er den tværgående funktion, der overvåger korrekt udførelse af alle de andre. Det styrer opdateringsprocessens data , dokumentation af data ( metadataene ), sikkerhed , sikkerhedskopiering og hændelsesadministration.

Beslutningsprojekt

I en virksomhed vokser mængden af ​​behandlede data hurtigt over tid. Disse data kan komme fra leverandører, kunder, miljøet osv. Denne mængde data stiger afhængigt af sektoren og virksomhedens aktivitet. For eksempel i supermarkeder er mængden af ​​data, der indsamles hver dag, enorme (især når butikker indsamler kassekvitteringer).

Virksomheden har flere muligheder for at behandle denne datastrøm:

Beslutningsprojektet svarer til denne sidste mulighed. Det handler om behandling af data og lagring af dem konsekvent, når det kommer sammen. Derfor er beslutningsprojektet et projekt uden tidsbegrænsning. Det vil sige, at så snart virksomheden starter dette projekt, stopper det ikke (undtagen i undtagelsestilfælde). Wal-Mart (en supermarked kæde ) er en af de virksomheder, der lagrer de fleste data (det har ganget sine data med 100 i et par år) og vil nå i de kommende år Den petabyte (1.000 terabyte ).

For at udføre disse beslutningsprojekter er der et væld af værktøjer, som hver især er tilpasset virksomhedens størrelse, strukturen af ​​eksisterende data og den ønskede type analyse.

Påmindelse om beslutningens værdikæde

Fase til indsamling af krav

Tre områder skal særligt dokumenteres:

  1. den type information, som brugeren har brug for
  2. reproduktionstypen (ergonomi, frekvens, reproduktionshastighed)
  3. det eksisterende tekniske system: anvendte teknologier
Design og teknisk valgfase

Dette fører til valget af præcise teknologier og en bestemt model.

Open source aktører

Skuespillere, der ejer

Noter og referencer

  1. ”  Hvad er Business Intelligence (BI)?  "
  2. Metodologi for et datalagerprojekt [1]
  3. hvordan man forespørger om en AzureSQL-database [2]
  4. beskrivelse af Dodeca spreedsheat Management System [3]
  5. Legal Recovery BI BOARD http://www.procedurecollective.fr/fr/redressement-judiciaire/1322625/biboard.aspx
  6. beskrivelse af BIME [4]
  7. beskrivelse af bestyrelsen [5]
  8. beskrivelse af BrightAnalytics [6]
  9. BusinessObjects-pakken [7]
  10. [8]
  11. [9]
  12. Beskrivelse af OBIEE [10]
  13. Hyperion-beskrivelse “  https://www.solution-bi.com/solution-bi/solutions-epm/expert-bi-oracle-hyperion-ing/  ” ( ArkivWikiwixArchive.isGoogle • Hvad skal jeg gøre? )
  14. beskrivelse af qlikView [11]

Se også

Relaterede artikler

Bibliografi