Hvad er open source datavisualisering?
Et datasæt kan indeholde en enorm mængde information. Det kan imidlertid være vanskeligt at skelne nogen af disse oplysninger ved at se på de enkelte poster. Open source-datavisualiseringssoftware tillader dataanalytikere og andre personer at illustrere og analysere specifik information fra store datasæt gratis.
Forskellige typer information illustreres bedst med forskellige typer diagrammer, grafer eller grafik. Enkle eksempler på datavisualisering inkluderer linjediagrammer og cirkeldiagrammer. Linjediagrammer viser tendenser i ændringen af numeriske data over tid, såsom udsving i et produkts priser eller salgstall. Cirkeldiagrammer viser koncentrationer af datakategorier - såsom procentdelen af de vælgere, der valgte en bestemt kandidat til embedet, eller demografisk information om disse vælgere.
Mere sofistikeret information kræver mere komplekse visualiseringer. Netværksanalyse, et voksende område inden for kvantitativ forskning, er en sådan metode, der kræver avanceret visualiseringssoftware. Dette involverer kortlægning af forbindelserne mellem forskellige dataregistreringer for at skelne information om komplekse forhold mellem datapunkter. Oprettelse af en visuel repræsentation af et sådant netværk fra et datasæt kræver software, der kan køre de nødvendige beregninger for automatisk at placere noder, der repræsenterer individuelle dataindgange, i et tredimensionelt rum, der skal forbindes med linjer.
Virksomheder og uafhængige analytikere kan købe proprietær software, der kan skabe både grundlæggende og avancerede datavisualiseringer. Et alternativ til at betale for disse programmer er at bruge open source datavisualiseringssoftware. Programmerere opretter open source-software ved at offentliggøre kildekoden til deres programmer på Internettet for enhver, der kan hente, se og kompilere sig selv. Da kildekoden er frit tilgængelig på Internettet, er softwaren gratis for alle at bruge. Open source-visualiseringssoftware kan spare virksomheder og dataanalytikere penge, men mangler muligvis de mere avancerede funktioner, som proprietær software, der skal købes, kan omfatte.
Software til visualisering af open source-data kan også have form af webservices, der bruger indholdet af et websted som datasæt. Disse kan oprette grafik, såsom ordskyer. Dette er samlinger af almindelige ord på webstedet - og jo hyppigere der vises et bestemt ord, jo større vil dens størrelse i forhold til andre ord være.
Prisen på proprietær software kan sætte open source-datavisualiseringsprodukter uden for rækkevidde for mange enkeltpersoner, såsom amatørbloggere eller studerende. Disse mennesker kan dog drage stor fordel af muligheden for at integrere denne slags grafik i deres websteder eller forskningsprojekter ved hjælp af open source datavisualiseringssoftware. På grund af denne softwares open source-art kan enhver programmør bidrage med ny kildekode for at tilføje nye funktioner og funktionalitet for alle, der vælger at bruge den.