Skip to content
View ericmartinezr's full-sized avatar
👿
I am the danger!
👿
I am the danger!

Block or report ericmartinezr

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
ericmartinezr/README.md

Proyectos ETL

Google Cloud Platform

Azure

Proyectos en local

  • Airflow Scrapper: Proyecto con Airflow (standalone) para scrapping de sitios como Emol y Mercadopublico.
  • Airflow Helm: Proyecto con Airflow desplegado en Kubernetes (Docker Desktop). Con algunas cosas interesantes como MLFlow.
  • [Apache Beam] E-commerce: Proyecto muy simple para reforzar conceptos de filtrado, enmascarado y normalización usando Apache Beam con datos ficticios.

Otras plataformas

  • DBT + Snowflake: Proyecto para la limpieza, enriquecimiento y carga de datos en Snowflake con el uso de Data Build Tool.

Proyectos IA / ML

Google Cloud Plataform

  • Document AI: Sistema que permite "conversar" con documentos (PDF).
    • Frontend: Angular y FastAPI (BFF)
    • Backend: FastAPI y LangChain
    • GCP: Cloud Storage, Cloud SQL, Vertex AI (Modelos Gemini), API Gateway, Artifact Registry, Cloud Build, entre otros

Azure

  • Databricks Lakeflow Jobs: Proyecto de entrenamiento de un modelo ML usando Databricks y MLFlow usando el dataset de Iris.

Otros

  • LangChain RUT Middleware: Un middleware para LangChain que permite redactar (ocultar) los RUTs Chilenos de las respuestas de los modelos.

Pinned Loading

  1. document_ai document_ai Public

    Small agentic AI app to extract information from documents, save it to files and send them through email

    Python

  2. document_ai_gcp document_ai_gcp Public

    Document AI on GCP

    Python

  3. etl_indicadores_gcp etl_indicadores_gcp Public

    ETL de indicadores en GCP

    Python

  4. etl_censo_gcp etl_censo_gcp Public

    ETL con datos del censo de Chile

    Python

  5. etl_censo_databricks etl_censo_databricks Public

    ETL del Censo 2024 con Databricks

    Jupyter Notebook

  6. etl_books_ml etl_books_ml Public

    ETL de libros con ML en GCP

    JavaScript