Unified Cloud Data Platform

Deze oplossing bevat een overzicht van een moderne gegevensarchitectuur. Azure Databricks vormt de kern van de oplossing. Dit platform werkt naadloos samen met andere services, zoals Azure Data Lake Storage Gen2, Azure Data Factory, Azure Synapse Analytics en Power BI.

Moderne gegevensarchitecturen die voldoen aan deze criteria:

  • Gegevens, analyses en AI-workloads worden samengevoegd.

  • Op elke schaal efficiënt en betrouwbare uitvoering.

  • Inzichten worden geboden via analysedashboards, operationele rapporten of geavanceerde analyses.

Afhankelijk van uw use case wordt een analyse gemaakt en een keuze uit de volgende componenten

Azure Databricks

is een platform voor gegevensanalyse. De volledig beheerde Spark-clusters verwerken grote gegevensstromen uit meerdere bronnen. Azure Databricks schoont en transformeert structuurloze gegevenssets. De verwerkte gegevens worden gecombineerd met gestructureerde gegevens uit operationele databases of datawarehouses. Azure Databricks traint en implementeert ook schaalbare machine learning- en deep learning-modellen.

Azure Databricks SQL Analytics

voert query's uit op data lakes. Met deze service worden ook gegevens in dashboards gevisualiseerd.

Event Hubs

is een platform voor het streamen van big data. Als paaS (platform as a service) wordt deze service voor gebeurtenisopname volledig beheerd.

Azure Data Factory

is een hybride gegevensintegratieservice. U kunt deze volledig beheerde, serverloze oplossing gebruiken om werkstromen voor gegevenstransformatie te maken, te plannen en te organiseren.

Azure Data Lake Storage Gen2

is een schaalbare en veilige data lake voor analyse workloads met hoge prestaties. Deze service kan meerdere petabytes aan informatie beheren terwijl honderden gigabits aan doorvoer worden ondersteund. De gegevens kunnen gestructureerd, semi-gestructureerd of ongestructureerd zijn. Het is meestal afkomstig van meerdere, heterogene bronnen, zoals logboeken, bestanden en media.

Machine Learning

is een cloudomgeving waarmee u predictive analytics-oplossingen kunt bouwen, implementeren en beheren. Met deze modellen kunt u gedrag, resultaten en trends voorspellen.

AKS

is een maximaal beschikbare, veilige en volledig beheerde Kubernetes-service. Met AKS kunt u eenvoudig toepassingen in containers implementeren en beheren.

MLflow

is een opensource-platform voor de machine learning-levenscyclus. De onderdelen bewaken machine learning-modellen tijdens het trainen en uitvoeren. MLflow slaat ook modellen op en laadt ze in productie.

Azure Synapse

is een analyseservice voor datawarehouses en big data-systemen. Deze service kan worden geïntegreerd met Power BI, Machine Learning en andere Azure-services.

Delta Lake

is een opslaglaag die gebruikmaakt van een open bestandsindeling. Deze laag wordt uitgevoerd boven op cloudopslag, zoals Data Lake Storage Gen2. Delta Lake ondersteunt gegevensversiebeheer, terugdraaien en transacties voor het bijwerken, verwijderen en samenvoegen van gegevens.

Visualisatie

Voor Visualisatie speelt Power Bi een prominent Role in.

Data Governance

Het is belangrijk om data access and data

DevOps en Iac

DevOps

Infrastructure As Code