Angel Ruiz Reche
Verified Expert in Engineering
数据科学家和软件开发人员
Angel是一名数据科学家,拥有超过五年的研究和商业经验,对数据充满热情, pattern finding, 建立解决问题的方法. 他非常健谈,积极主动,喜欢每天学习新事物. 他擅长用Python构建完整的解决方案, 从数据解析到创建专门的机器学习模型. So far, 他为银行业的初创公司和大公司做出了贡献, eCommerce, real estate, and bioinformatics.
Portfolio
Experience
Availability
Preferred Environment
Regex, Time Series Analysis, NumPy, Visual Studio Code (VS Code), Machine Learning, Bioinformatics, Scikit-learn, Pandas, Python, MacOS
The most amazing...
...我开发的深度学习应用叫做ReorientExpress. 它允许在没有参考的情况下破译基因序列(RNA剪接代码).
Work Experience
Data Scientist
Treat Technologies, Inc
- 使用BigQuery ML创建ML模型,预测客户在与商家第一次互动后重复购买的可能性.
- 使用谷歌的Vertex AI创建机器学习模型,预测在线买家的估计客户终身价值.
- 使用Jupyter Notebooks在大数据集上执行详尽的EDA和数据准备, BigQuery, and Google's Dataprep.
数据科学家和机器学习工程师
Visibly Works LLC
- 设计并开发了一个模型,该模型建议在亚马逊上展示哪些广告,以及以何种顺序最大化特定产品的转化率. 它使用了交通、转换、地理和人口数据.
- 创建了一个模型,根据内容将电子商务广告活动分类, performance, keywords, and more. 这有助于标准化来自不同广告商的广告活动,并根据他们的目标提高他们的表现.
- 建立一个预测当天活动支出的管道,用于预测活动何时将耗尽预算并建议新的预算, 还有潜在的流量和转化率损失.
- 开发了一款生成合成广告数据的应用. 可以将这些数据显示给潜在客户,以在不暴露私有数据的情况下展示产品.
- 创建了一个工具,定期运行我们所有客户的数据库,发现潜在的错误条目. 这有助于管理数据库并增加与客户的信任.
- 建立一个模型,根据目标产品建议在广告活动中包含哪些关键字, past performance, 以及出价多少才能达到一个特定的目标.
- 创建了一个网络抓取工具来提取亚马逊的产品类别. 它处理嵌套的链接并跟踪已经访问过的链接. 输出结果保存到Excel文件中.
Lead Data Scientist
Lurtis Rules
- 开发了几个用于解析、结构化和分析商业房地产数据的管道. 使用数据和分析构建基于机器学习的预测和预测工具,以最大限度地提高投资者的收益.
- 创建了几个机器学习模型,帮助投资者根据人口统计决定投资哪些房地产建筑, geographical, and macroeconomic data.
- 运用计量经济学分析,为投资者提供下一个宏观经济趋势的见解.
- 与客户保持密切联系, product owner, 和产品经理一起实现项目目标和客户的需求.
- 在Jira中使用敏捷方法,在GitHub中执行持续的代码维护.
- 创建了一个Python web scraper工具,从房地产门户中提取数据. 它不断提取最新的数据, 解析属性的描述,S,并将相关信息提取到表格中.
数据科学家和团队领导
Banco Santander
- 根据这个想法开发和编码Python和R包, code, 并测试到最终独立的dockerized包.
- 创建NLP工具,自动处理不同的文档,将它们分类为最可能的文档类型,并提取相关信息存储在数据库中.
- 领导一个小的开发团队并协调他们. 与其他部门保持密切沟通,确保快速取得成果,并直接向上级领导汇报.
Data Scientist
剑桥癌症研究所
- 开发了基于机器学习的提取工具, analyze, 从最大的医学期刊库中分类论文, PubMed.
- 创建了一个深度学习NLP工具,从作者的论文及其元数据中学习模式. 它可以猜测谁写了一篇文章,并区分同名作者.
- 使用创建的工具来提取来自不同领域的作者的见解, countries, 大学的行为和与其他作者和主题的联系.
数据科学家和生物信息学开发人员
巴塞罗那生物公园
- 使用机器学习模型和数据科学工具研究替代拼接.
- 开发了一种深度学习工具,可以以99%的准确率预测样本来自哪个组织.
- 开发了另一个深度学习工具,可以预测特定组织的基因表达, 它们对特定药物的潜在反应, 以及他们是否处于健康状态.
Experience
ReorientExpress:深度学习工具基因表达预测
http://github.com/comprna/reorientexpressThis highlights one of the biggest advantages of deep learning; it can simulate complex systems without having to simplify the process into simple rules. 相反,它可以学习其他机器学习模型无法学习的复杂交互.
DeepOracle
http://github.com/angelrure/DeepOracle每日竞选预算预测器
这些预测被发送到一个网络应用程序中,客户可以在其中看到哪些活动可能在白天超出预算,以及超出多少.
他们还会得到可能错过的流量和转换事件的估计,以及建议的预算增加,以避免超出预算. 因此,他们的竞选活动总是在预算之内.
增强内省:Emel
http://store.steampowered.com/app/2189350/Augmented_Introspection_Emel/?curator_clanid=4777282&utm_source=SteamDB在这个基于对话的视频游戏中, 用户通过文本输入与人工智能助手交流,并可以执行几个测试, psychological tests games, and more. 它使用谷歌云服务,例如:
•存储:存储用户行为数据和游戏事件数据.
•功能:允许GCP和视频游戏之间的通信. 它使用几个端点来完成特定的任务.
•文本转语音API:结合功能,它允许人工智能助手说话.
这款游戏探讨了超人类主义、享乐主义和个人主义等主题.
ETL Orchestration using AWS
然后,数据被解析、处理、清理,然后上传到AWS的Redshift. 数据也经过了同质化处理,因此可以同时查询不同的数据源. 该管道计划每天午夜自动运行. 整个过程在短短4天内完成了完整的记录和开发.
Finally, 数据被连接到一个外部仪表板解决方案(Metabase),在那里它可以实时可视化.
Skills
Languages
Python, Regex, SQL, Python 3, R, GML
Libraries/APIs
Pandas, Scikit-learn, Keras, TensorFlow, Matplotlib, NumPy, REST api, Beautiful Soup, PySpark
Tools
Jupyter, Git, Bitbucket, GitHub, Biopython, Amazon Athena, BigQuery, Amazon CloudWatch
Paradigms
数据科学,RESTful开发,ETL,商业智能(BI),软件测试
Platforms
Jupyter Notebook, Visual Studio Code (VS Code), AWS Lambda, Docker, Amazon Web Services (AWS), Google Cloud Platform (GCP), Steam, Databricks
Other
Machine Learning, Data Analytics, Predictive Analytics, Supervised Learning, Data Analysis, Time Series Analysis, Algorithms, Mathematics, Statistics, Computer Science, Visualization, Forecasting, OCR, Text Classification, Data Mining, Deep Neural Networks, Deep Learning, Neural Networks, Artificial Intelligence (AI), APIs, Unsupervised Learning, Data Modeling, Web Scraping, Time Series, 自然语言处理(NLP), Commercial Real Estate, Biotechnology, Next-generation Sequencing, Biomedical Skills, Monte Carlo Simulations, Reinforcement Learning, eCommerce, Macroeconomic Forecasting, Econometrics, Psychology, Philosophy, Cloud Storage, Google Cloud Functions, Text to Speech (TTS), Google BigQuery, Vertex, Metabase, HubSpot, Web Crawlers
Storage
PostgreSQL, MySQL, Elasticsearch, Google Cloud, MongoDB, Google Cloud Storage, Redshift
Industry Expertise
Bioinformatics
Education
数据科学硕士学位
瓦伦西亚国际大学-瓦伦西亚,西班牙
生物信息学硕士学位
庞培法布拉大学-巴塞罗那,西班牙
生物技术学士学位
莱伊达大学-莱伊达,西班牙
Certifications
Machine Learning Nanodegree
Udacity
How to Work with Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
Share your needs
Choose your talent
开始你的无风险人才试验
Top talent is in high demand.
Start hiring