Je vais mettre en place une pipeline d'analyse d'événements auto-hébergée avec chargement de données brutes dans bigquery
Ingénieur Data et Ingénieur en Analyse
À propos de ce service
Si vous souhaitez avoir la propriété de vos données d'analyse sans dépendre entièrement des plateformes de suivi tierces, je peux configurer une pipeline d'événements auto-hébergée pour vous.
Ce projet est conçu pour les équipes qui veulent une base d'analyse propre et pratique :
- suivi d'événements personnalisé
- propriété des événements bruts
- stockage portable
- requêtes compatibles avec BigQuery
- support pour web, backend, application ou jeux
Ce que je livrerai
- déploiement d'une API d'ingestion d'événements
- collecte d'événements via clé API
- mise en mémoire tampon des événements via NATS JetStream
- stockage des événements bruts sous forme de fichiers Parquet partitionnés dans Google Cloud Storage
- configuration d'une table externe BigQuery pour interroger les données brutes
- configuration pour votre premier producteur d'événements
- version open source de Metabase (optionnel)
Cas d'usage typiques
- analyse produit pour applications web/mobile, extensions de navigateur
- système de suivi d'événements backend personnalisé
- fondation d'événements bruts avant tableaux de bord ou BI
- analyse de jeux
Note importante sur le périmètre
Ce projet met en place l'infrastructure d'ingestion d'événements et d'analyse brute.
Il ne comprend pas :
- un tableau de bord d'analyse terminé
- une mise en œuvre avancée de BI
- une interface complète d'analyse produit
Exigences du projet
- sous-domaine
- projet GCP, VM que je vais aider à configurer
Destination Platform:
Google BigQuery
•
Google Cloud Storage
Outils et plateformes:
Autres
FAQ
Traduction automatique
Qu'est-ce que DataQuery (offre actuelle du projet) ?
DataQueryEvent est une pipeline auto-hébergée de suivi d'événements in-app, d'ingestion et de stockage brut pour l'analyse de produits, applications et jeux. C'est un projet open source développé et maintenu par moi.
DataQuery est-il une plateforme d'analyse SaaS ?
Non. DataQuery est une pipeline d'analyse auto-hébergée déployée dans votre infrastructure.
Qui héberge le système ?
C'est vous. La configuration par défaut supporte votre propre VM et les services Google Cloud si nécessaire.
Que se passe-t-il lorsque le volume d'événements augmente ?
La configuration par défaut commence simplement, généralement sur une seule VM, et peut être évoluée ultérieurement à mesure que votre trafic augmente. La VM cloud est facile à faire évoluer, la performance de calcul peut généralement être augmentée en modifiant simplement les paramètres dans l'interface.
Où sont stockées les données brutes ?
Les événements bruts sont écrits dans le stockage blob au format Parquet (Google Cloud Storage par défaut).
Quels produits peuvent utiliser cela ?
Applications web, sites internet, applications mobiles, extensions Chrome, jeux et services backend.
Est-ce que je possède les données ?
Oui. Le système est conçu autour de la propriété des données brutes et de leur portabilité.
Pouvez-vous aider à définir le schéma des événements ?
Oui. Je peux vous aider à structurer les noms d'événements, paramètres et limites du producteur.
Cela inclut-il des tableaux de bord ?
Non, ce projet se concentre sur l'ingestion et l'infrastructure d'analyse brute, mais je peux déployer une version open source de Metabase pour vos besoins en BI. Le développement de tableaux de bord peut être ajouté séparément.
