Creëer ordening met Data Catalog

Met Data Catalog kunt u een bedrijfsbrede catalogus van metagegevens opbouwen, die de vindbaarheid en bruikbaarheid van uw data sterk verbetert.

Evolutie, geen revolutie

In de digitale wereld bent u soms langer bezig met het zoeken naar gegevens, dan met het analyseren ervan.  Er is niets nieuws onder de zon, het categoriseren van gegevens doen we al heel lang maar op verschillende wijze. Bijvoorbeeld door middel van kaartenbakken en etiketten. Voortschrijdende technologie zorgt ervoor dat onze inzichten en omgang met data continu evolueert. Kaartenbakken evolueren van een database naar een datacenter. Etiketten evolueren van labels naar digitale tags.

Metadata doet zijn intrede

Metadata zijn gegevens die de karakteristieken van bestanden beschrijven. Het zijn dus eigenlijk specifieke kenmerken van de data. De metadata bij een bepaald document (de kenmerken) kunnen bijvoorbeeld zijn: de auteur, de datum van schrijver, de uitgever, het aantal pagina’s en de taal waarin de gegevens zijn opgesteld. Het bewaren bij of koppelen van metadata aan het bestand waarop ze betrekking hebben, heeft als voordeel dat het bestand makkelijker gevonden kan worden. Zo kan men in een zoekmachine die gebruikmaakt van metadata bijvoorbeeld direct zoeken naar documenten geschreven door een bepaalde auteur. Met full-text zoeken, dus zonder gebruik te maken van metadata, is dit moeilijker, omdat elk document waarin de naam van de auteur voorkomt wordt gevonden. Dit kunnen er veel meer zijn dan de documenten die daadwerkelijk door de persoon geschreven zijn.

Om metadata te kunnen gebruiken, moet dit specifiek worden toegevoegd aan alle bestanden, documenten, gegevens, etc. Traditioneel is het categoriseren van een document de taak van een bibliothecaris en/of archivaris. Soms is dit eenvoudig automatisch te doen (zoals het bepalen van het aantal pagina’s), maar soms is menselijke interventie vereist voor het extraheren van de naam van de auteur uit een tekstdocument, of het toewijzen van bepaalde trefwoorden. Hier komt Talend Data Catalog om de hoek kijken. Data Catalog structureert en ontzorgt u bij het categoriseren van uw data door slimme tooling en geautomatiseerde processen.

Haal meer uit uw gegevens met Talend Data Catalog

Daarnaast genereren we met z’n allen heel veel data op diverse vlakken, zoals Global, Social en Business data. Om deze hoeveelheid data goed te kunnen benutten is een optimale categorisering van belang. Talend Data Catalog is tooling om een bedrijfsbrede catalogus van metadata op te bouwen. De tooling van Talend detecteert en analyseert de data, zodat het voor gebruikers gemakkelijker wordt om de gegevens/-bronnen te registreren, verrijken, ontdekken, begrijpen en verwerken.

Data Catalog archiveren

De voordelen van Data Catalog

Verborgen waarde komt tevoorschijn

Data opslaan die niet teruggevonden kan worden, is vergeefse moeite. Door een efficiënte categorisering brengt Data Catalog de verborgen gegevens van uw bedrijf aan het licht. Denk dan aan kenmerken als type, auteur, aanmaakdatum, systeem, taal, rechten, etc. Zodoende zijn de gewenste gegevens sneller en gemakkelijker voorhanden, zodat u meer tijd kunt besteden aan het gebruik van de data.

Wilt u weten wat Data Catalog u kan opleveren?

Onze dataspecialisten kunnen u in woord en daad adviseren bij het inrichten van een Data Catalog proces. Neem contact met ons op voor een vrijblijvend advies gesprek.