Pau Labarta Bajo,西班牙巴塞罗那的开发者
Pau is available for hire
Hire Pau

Pau Labarta Bajo

Verified Expert  in Engineering

Mathematical Modeling Developer

Location
Barcelona, Spain
Toptal Member Since
April 24, 2019

Pau是一名数据科学家和机器学习工程师,拥有超过8年的经验. 从开发到部署,他都热衷于构建基于ml的解决方案. 他喜欢将想法转化为模型,再将模型转化为API或产品. 保罗研究过不同的问题:金融衍生品定价, digital marketing analytics, deep learning for art generation, 或者对网上购物的需求预测. 他的背景是纯数学,他有很强的Python编程技能.

Availability

Part-time

Preferred Environment

亚马逊网络服务(AWS)、PyCharm、MacOS

The most amazing...

...我建立的模型是一个生成式神经网络,它可以为手机游戏中的足球运动员创建逼真的头像.

Work Experience

Machine Learning Engineer

2021 - PRESENT
EasyHealth
  • 开发基于ml的竞标机器人,以获得更经济有效的线索.
  • 开发客户流失预测模型,预测政策流失,提高客户保留率.
  • 构建仿真引擎,优化日常操作的关键参数.
技术:Google Cloud Platform (GCP), Python

Time Series ML Engineer

2021 - 2021
Cogsy Limited
  • 验证并改进了Cogsy应用的预测方法.
  • 为快速实验构建了一个内部Python包, leveraging Amazon Forecast AutoML, and custom feature engineering.
  • 为Cogsy的几个客户开发了特别的预测模型.
技术:亚马逊网络服务(AWS), Python 3, DeepAR

Data Engineer

2020 - 2021
Speakeasy Labs
  • 增加了市场分析管道的健壮性.
  • 帮助定义和执行一个事件跟踪系统,以适应新的iOS 14跟踪限制.
  • 就与Segment相关的特定底层细节向客户提供建议.io.
Technologies: REST APIs, Segment

Machine Learning Engineer

2020 - 2020
Lola Market - Freelance
  • 开发、部署和维护机器学习模型,以提高购物者的效率.
  • 引导公司的第一个数据仓库和报告层, including Amazon Redshift, 亚马逊数据库迁移服务(DMS), and Tableau.
  • 开发了多个仪表板,帮助客户提高车队管理效率.
技术:亚马逊网络服务(AWS)、Python、Scikit-learn

机器学习工程师|统计学家

2020 - 2020
Toptal Client
  • 使用可解释的机器学习分析海湾地区的金融市场估值.
  • 编写了一个Python包,以确保分析的每个步骤的内部再现性, including data processing, data validation, data visualization, model construction, model validation, and model explanation.
  • 对一系列ML解决方案进行基准测试,并对其进行微调,以提高模型的准确性和可解释性.
技术:shape, Statistics, Scikit-learn, Machine Learning, Python

Explainable AI Engineer

2020 - 2020
15kay
  • 支持医学领域科学Python包的开发.
  • 研究包在开源ML和AI生态系统中的适用性.
  • 创建教程笔记本,以展示该包的潜在用途.
技术:可解释人工智能(XAI), TensorFlow, Jupyter, Python

Data Scientist | Data Engineer

2019 - 2020
Goguru Consulting
  • 部署了客户端的第一个数据仓库和数据报告系统.
  • 使用Python从头开始开发分析堆栈的组件, SQL, AWS Redshift, and Tableau Online.
  • 开发机器学习模型,提高萝拉市场的运营效率, a client of Goguru. Lola Market为顾客提供在线购买食品杂货的服务,并在几小时内送货上门.
Technologies: Random Forests, Scikit-learn, Amazon Web Services (AWS), Tableau, Python, AWS Database Migration Service, Redshift

数据可视化|数据工程师

2019 - 2020
Cyngn
  • 在Cyngn上创建、更新和维护数据分析堆栈的前端仪表板.
  • 在Tableau中开发快速可视化原型,并将其部署到工程团队可以访问的仪表板中.
  • 用Python和SQL开发内部ETL工具组件.
  • 帮助后端工程师在Amazon Redshift中集成前端和后端堆栈.
技术:亚马逊网络服务(AWS)、SQL、Tableau、Redshift

数学c++开发人员(遗传学项目)

2019 - 2019
Confidential
  • 审查并记录了执行基调用的专有算法.
  • 向客户提供改进现有算法的建议.
  • 调试代码并提出改进建议以提高准确性.
Technologies: C++, OpenCV

Machine Learning Engineer

2019 - 2019
Toptal Client
  • 开发统计和机器学习模型,以了解金融机构的市场估值.
  • 为数据科学创建了一个可复制的管道, 从数据转换到超参数模型调优.
  • 特别强调了模型的可解释性.
技术:Scikit-learn, Jupyter, Python

数据科学家|机器学习工程师

2016 - 2019
Nordeus
  • 创建了一个神经网络模型,以可扩展的方式生成足球运动员的面孔. 该模型的输出用于该公司的一款游戏.
  • 在Top Eleven游戏中设计配对算法, 一个足球经理模拟使用博弈论和蒙特卡罗技术在全球超过2亿用户.
  • 与内部客户支持团队合作,使用NLP技术自动标记玩家投诉的过程.
  • 开发一个预测模型来估计营销活动的ROAS(广告支出回报).
  • 管理两名初级数据科学家,负责商业智能和游戏系统设计.
技术:Scikit-learn, Tableau, Impala, Hadoop, Python, Data Analysis

Quantitative Risk Analyst

2012 - 2016
Erste Group Bank
  • 在MATLAB和Python中实现并验证了Erste Group Bank用于定价和对冲利率衍生品的所有模型.
  • 为每个经过验证的模型编写详尽的文档,提交给欧洲中央银行.
  • 对用于估计银行和交易帐簿的信贷市场风险的方法提出并实施改进.
  • 对不同风险价值模型的性能进行回溯测试,以对银行使用的方法提出改进建议.
  • 指导加入团队的初级定量风险分析师.
Technologies: MATLAB, Python

逼真的人脸生成器移动应用金靴2019

我想要解决的问题是完全自动化为公司的几款游戏生成足球运动员个人资料图像的过程. 该系统用于手机游戏《欧博体育app下载》, available in both iOS and Android, 自发布以来,安装量已超过100万次.

我构建了一个由三个模型组成的管道,每个模型依次应用. First, 一个尖端的GAN网络,经过我自己的数据集的重新训练,生成了逼真的足球运动员面孔. Second, 从VGG网络的最后一层构建的逻辑分类器, 将GAN的输出分为“好”脸和“坏”脸, 确保只有足够质量的图像显示给用户. Third, 在VGG网络的最后一层之上进行另一种逻辑回归,根据种族对人脸进行分类. 这最后一步是必要的,以便控制足球运动员的国籍和他的外表之间的相关性.

客户支持自动化与自然语言处理

一个自然语言处理系统,自动对客户问题进行分类. 这个工具是我在Nordeus工作期间开发的, 一家日活跃用户超过200万的手机游戏公司. 最终目标是减少人工代理必须处理的门票数量, 提高客户的整体满意度.

使用机器学习的金融市场估值和解释

一套机器学习模型,用于量化和解释海湾地区银行机构的估值. 我是机器学习工程师,负责根据客户的数据可用性和最终目标设计和实现这样一个系统.

基于梯度推进的机队优化与需求预测

http://lolamarket.com/es/en/
Lola Market是一家西班牙初创公司,它可以让你在你最喜欢的商店网上订购杂货,然后送货上门. 该公司有一个去商店的购物队, do the shopping, and take it to the user's house.

Lola的运营团队面临的一个大问题是:“在一天中的每个地点和时间,应该有多少购物者可以使用,以保证我们的用户100%可用,并最大限度地减少购物者空闲时间。?". 该项目的目标是自动化和改进地理位置和时间段的购物者分配.

我开发的解决方案是一个机器学习(ML)模型,可以预测每个地理位置(城市)未来的用户需求, (地区)及以后两星期的办公时间. 我还开发了一套Tableau仪表板,使系统对Lola的运营团队透明.

动手强化学习课程

http://datamachines.xyz/the-hands-on-reinforcement-learning-course-page/
创建并发布了一个关于强化学习(RL)的在线课程, 从基础知识到尖端的深度强化学习.

该课程在网上免费提供.

The goal is to teach my students, with a hands-on approach, 如何从头开始使用Python和PyTorch实现关键的RL算法.

Languages

Python, SQL, C++, Python 3

Frameworks

Flask, Hadoop

Libraries/APIs

Scikit-learn, Keras, TensorFlow, OpenCV, PySpark, REST api, shaely, XGBoost, PyTorch

Tools

Tableau, PyCharm, Impala, MATLAB, Jupyter

Paradigms

Data Science

Other

Machine Learning, 自然语言处理(NLP), Statistics, Statistical Modeling, Computer Vision, Quantitative Finance, Mathematical Modeling, Data Visualization, GPT, 生成预训练变压器(GPT), Time Series Analysis, Deep Learning, AWS Database Migration Service, 可解释人工智能(XAI), Data Engineering, Segment, Random Forests, Mathematics, Optimization, Genomics, Custom BERT, DeepAR, Deep Reinforcement Learning, Reinforcement Learning, Data Analysis

Platforms

谷歌云平台(GCP)、亚马逊网络服务(AWS)、MacOS

Storage

Redshift

2011 - 2012

数量经济学硕士学位

威尼斯Ca'Foscari大学-威尼斯,意大利

2010 - 2011

数量经济学硕士学位

比勒费尔德大学-比勒费尔德,德国

2005 - 2010

Master's Degree in Mathematics

加泰罗尼亚理工大学-巴塞罗那,西班牙

JULY 2005 - PRESENT

参加第46届国际数学奥林匹克竞赛

国际数学奥林匹克竞赛