克莱顿柠檬,美国纽约州伊萨卡市的开发商
Clayton is available for hire
Hire Clayton

克莱顿柠檬

验证专家  in Engineering

软件开发人员

Location
美国纽约州伊萨卡
至今成员总数
2020年4月23日

Clayton是一名变革性的软件工程师和领导者,在软件行业拥有超过15年的经验, 在数据交叉点进行创新, AI/ML, 云工程. 作为个人贡献者和有远见的领导者, 他是将挑战转变为以用户为中心的动力, 高质量的软件解决方案. 以精通技术而闻名, 战略远见, 和有原则的软件方法, 克莱顿提升团队的协作和表现最好.

Portfolio

U.S. 退伍军人事务部
大数据、数据库、ETL工具、数据管理、IT战略、云
Elevance健康
代码评审,指导,职业指导,技术领导,软件设计...
Elevance健康
JupyterLab, Jupyter笔记本, Spark, PySpark, MLflow, Feast, Pachyderm...

Experience

Availability

Part-time

首选的环境

Full-stack, TypeScript, PostgreSQL, Docker, Scala, Python, Kubernetes, 亚马逊网络服务(AWS), React, 机器学习操作(MLOps)

最神奇的...

...我设计和开发的解决方案是部署在Kubernetes上的内部AI/ML平台, 利用的, JupyterHub, Spark, MLflow, Feast, 和厚脸皮的人.

工作经验

企业战略架构师

2023年至今
U.S. 退伍军人事务部
  • 制作了一份详细的大规模技术战略文件, 基于云的数据和分析平台.
  • 修改现有的架构图,并创建新的架构图,以支持技术策略文档.
  • 策划一种新型合成数据生成系统的试验.
技术:大数据、数据库、ETL工具、数据管理、IT战略、云

人工智能技术高级总监

2023 - 2023
Elevance健康
  • 管理一支精通AI/ML的8人工程团队, 数据科学, 后端API开发, and DevOps, 营造多样化的技术环境.
  • 指导了8名工程师的技术和领导技能, 使两名工程师能够实现技术领导角色.
  • 监督云原生的维护, 基于JupyterHub的弹性AI/ML平台,以及为超过7000万患者处理HL7 FHIR资源的数据管道, 处理数十亿的索赔和临床记录.
  • 领导一个跨职能团队,在Google Kubernetes Engine上开发一个以研究为重点的数据科学平台, 确保7000多万患者安全访问未识别数据.
  • 使用Kasm设计了一个安全的解决方案,以防止数据科学平台上运行的基于容器的JupyterLab工作区的数据泄露.
  • 为数据科学平台提供了一个定制的JupyterLab环境,并配备了一套广泛的AI/ML工具.
  • 架构是安全的, 多租户持久存储系统,以支持JupyterLab工作区中的用户和共享项目数据, 使用安装了gcsfuse的Google云存储桶.
  • 为创新的合成数据生成系统设计部署策略.
  • 担任llm驱动的云工程主管, 企业社会责任查询内部知识管理工具, 为LLM的开发、部署以及与工具前端应用程序的集成提供解决方案.
  • 在Kubernetes上实现Ray,支持自动缩放和GPU,并展示了它使用完全分片数据并行(FSDP)技术微调700亿参数的Llama 2 LLM的能力.
Technologies: 代码评审,指导,职业指导,技术领导,软件设计, 软件架构, 反馈评论, Agile, Scrum, 软件项目管理, Kubernetes运营(kOps), Director, 软件工程, 跨职能团队领导, 战略规划 & 执行,想法综合和应用,员工管理 & Development, 目标管理, 项目协调, 业务需求, 开源llm, 大型语言模型(llm), 新产品开发, Google Kubernetes Engine (GKE), 谷歌云平台(GCP), 谷歌云存储, JupyterLab, Jupyter笔记本, React, Python, FastAPI, Terraform, 跨职能的合作, Datadog, Ray, PyTorch, Llama 2, Fine-tuning, 数据级安全, 防止数据泄露, Git, 云部署, 完整的开发, Leadership, 团队的领导, 远程团队领导, Snowflake, Protegrity, 检索增强生成(RAG), ChatGPT, Chatbots

人工智能软件工程主管

2021 - 2023
Elevance健康
  • 领导架构和团队在AWS上构建和部署云原生AI/ML平台,以增强可扩展基础设施上的数据科学, 集成Kubernetes等技术, JupyterHub, Spark, MLflow, Feast, 和厚脸皮的人.
  • 为AI/ML平台部署提供安全的云帐户, 与内部委员会和DevSecOps团队密切合作,确保合规性和治理一致性.
  • 与DevSecOps工程师密切合作,率先在Amazon EKS上部署JupyterHub, 利用EFS, EBS, S3, 和自定义Docker映像来满足特定的用户环境需求.
  • 通过Auth0集成JupyterHub和MLflow开发单点登录(SSO)解决方案, 为用户提供无缝的身份验证体验.
  • 为AI平台用户开发高性能计算解决方案, 按需无缝集成, 可伸缩的GPU资源和弹性, kubernetes托管的Spark作业与JupyterHub.
  • 提出并贡献了Pachyderm的安全解决方案, 提高了其“JupyterLab厚皮兽Mount Extension”的安全性,并使其更易于用户集成.
  • 通过识别许多性能问题并提出新功能和优化建议,影响了Pachyderm的开发路线图, 其中一些已经实现.
  • 为数据科学家和工程师提供有效使用AI/ML平台的全面培训课程, 增强团队能力.
  • 领导跨职能团队在AI/ML平台上开发并实现2型糖尿病预测模型, 成功地倡导使用Feast和MLflow来实现MLOps的最佳实践.
  • 领导新一代FHIR管道的架构设计和开发,以取代旧的管道, 将7000万病人的处理时间从三周缩短到24小时,并大大降低了手术成本.
技术:JupyterLab, Jupyter笔记本, Spark, PySpark, MLflow, Feast, Pachyderm, Amazon EFS, Amazon EKS, Amazon EBS, AWS ELB, AWS IAM, AWS CLI, Amazon S3 (AWS S3), AWS自动扩展, Python 3, Python, GPU计算, 分布式计算, Big Data, 机器学习操作(MLOps), 技术领导, 体系结构, 软件设计, 机器学习, GitLab CI / CD, GitLab, Helm, 人工智能(AI), 单点登录(SSO), Artifactory, OCI构件注册表, Docker, Docker Hub, 码头工人组成, DevOps, HL7 FHIR标准, 优化, Git, 云部署, API集成, 团队的领导, 远程团队领导, Leadership, Protegrity, Snowflake

AI解决方案工程师执行顾问

2020 - 2021
Anthem
  • 进行全面的研究,以确定Pachyderm作为企业级COTS软件解决方案,满足管道编排的特定需求, 分布式处理, 增量处理, 数据跟踪和来源.
  • 推动厚皮公司的采购流程, 成功导航许可, 谈判, 和收购.
  • 指导并协助云工程师团队在企业的AWS云基础设施中部署Pachyderm, 特别是利用亚马逊的EKS.
  • 监督厚皮动物的运作, 为构建和执行大规模数据管道建立健壮的流程和最佳实践.
  • 组织的标准化和文档化的数据工程最佳实践.
  • 设计一个内部, 以患者为中心的健康轨迹数据结构, 显著提高数据科学家快速分析数据和开发人工智能驱动的健康模型的能力.
  • 领导设计和开发厚皮动物管道,将上述健康轨迹数据结构与来自7000多万患者的数据相结合, 包含2+ TB的数据.
技术:火花, PySpark, Kubernetes, Docker, Amazon EKS, Python 3, Python, Apache气流, Pachyderm, 数据管道, CI / CD管道, GitLab CI / CD, GitLab, Flake8, Pytest, pre-commit, 编制, 数据结构, Big Data, 数据科学, Code Review, Debugging, 软件测试, 分布式计算, 分布式软件, Negotiation, Procurement, COTS, 企业SaaS, Provenance, 数据沿袭, 人工智能(AI), IT Security, 技术领导, Git, 云部署, Snowflake, Protegrity

Toptal AI ETL解决方案工程师

2020 - 2020
圣歌AI -远程医疗/PIP
  • 引领复杂数据管道的设计和执行,使人工智能驱动的健康洞察从内部部署服务器无缝交付到基于云的应用程序.
  • 设计了一个基于python的API和存储框架,用于在Amazon S3上存储和检索ai驱动的健康洞察, 利用压缩, Base64编码, 索引的灵活性和效率.
  • 通过以代码审查的形式为数据科学家提供专业的ETL和ML管道工程支持,增强了数据科学操作, debugging, 结对编程, 以及性能优化.
  • 维护使用Hive、PySpark和Airflow构建的本地ETL管道组件.
  • 成功地向领导层倡导将本地ETL管道转变为云原生解决方案, 利用雪花, Kubernetes, PySpark, 和厚脸皮的人.
技术:Python, SQL, ETL, PySpark, 数据分析, 数据建模, 数据概要分析, Spark, Apache Hive, Hadoop, 数据管道, GitLab CI / CD, CI / CD管道, Apache气流, Kubernetes, Pachyderm, Snowflake, Amazon S3 (AWS S3), APIs, Frameworks, Storage, 人工智能(AI), 机器学习, Big Data, PyTorch, Python 3, Code Review, Debugging, 结对编程, Advisory, 亚马逊网络服务(AWS), AWS步骤函数, AWS Lambda, Bitbucket, Git, 云部署

研究软件工程师(机器学习)

2018 - 2020
GrammaTech
  • 通过使用Python实现数据和ML管道,加速大规模代码库的静态和二进制分析, MongoDB, 和JavaScript.
  • 通过scikit-learn实现瞳孔式ML模型,降低了二进制分析程序的计算成本.
  • 在Python中精心制作数据分析技术,以检测JavaScript函数中的安全问题, 例如在高阶延续风格函数中交换回调和错误参数.
  • 利用Doc2Vec模型对函数调用位置和定义进行矢量化, 通过参数和参数名称的语义相似性简化对交换参数的检测.
  • 在SaaS二进制分析工具中开发二进制扫描功能的后端.
技术:JavaScript, GitLab, Docker, C++, MongoDB, Keras, TensorFlow, Python, Scikit-learn, 机器学习, 统计分析, Bash Script, GitLab CI / CD, CI / CD管道, NumPy, Big Data, 并行编程, Git

软件工程师一至三级

2013 - 2020
国家仪器
  • 因出色的表现而获得认可, 获得“年度最佳新秀”奖, 多重快速晋升, 以及领导一个重要项目的机会.
  • 标准化和简化了NI-DCPower和NI-DMM产品系列中多个设备的固件下载框架.
  • 在Windows的NI-DCPower和NI-DMM驱动程序api中设计和实现了20多个功能, 最终用户可以直接看到许多改进.
  • 主导一个关键产品的三个主要功能的研究和定义, 与硬件团队的项目经理和各种利益相关者合作,确保协调一致并全面解决技术需求.
  • 设计并领导了针对电源输出控制的专有指令集的内部编程语言和编译器的开发, 支持灵活的设备行为重新配置和复杂的输出控制.
  • 实现了一个客户机-服务器系统,该系统支持NI-DCPower API驱动程序会话的远程管理, 便于调试和自省.
  • 通过实现Sublime Text插件来集成Perforce,提高了开发人员的工作效率.
  • 开发了一个VS Code扩展,将NI的自定义构建系统与微软的C/ c++扩展集成在一起, 启用语义代码补全等高级功能.
  • 研究了狼蛛断层定位技术, 成功创建了NI代码库的原型, 并在一次内部工程会议上展示了这一发现.
  • 指导10余名实习生和初级工程师.
技术:编译器设计, API Design, Firmware, Development, Windows, Visual Studio, Python, C++, Perforce, Windows内核驱动程序, TypeScript, 崇高文本3, Visual Studio Code (VS Code), Leadership, 团队的领导

Web开发人员

2012 - 2013
CleanTelligent软件
  • 优化了几个数据库查询和存储布局, 包括客户照片的文件存储系统, 将几个API响应时间缩短到几毫秒.
  • 为可定制的报表生成工具实现后端API.
  • 在网站的几个部分应用了一个新的UI主题.
技术:Apache Struts 2, HTML, CSS, JavaScript, 雅加达服务器页面(JSP), Java, PostgreSQL, CVS, 完整的开发

软件工程师实习生

2012 - 2012
国家仪器
  • 设计了一个重要的内核驱动程序功能,简化了驱动程序与10多个商业产品上嵌入式存储设备的通信.
  • 开发了一个代码生成工具来支持驱动程序特性, 它自动利用Python和Mako模板从元数据生成c++和LabVIEW代码.
  • 研究并介绍了用于代码生成工具的各种元数据模式格式的优缺点, 然后领导了一个协商一致的会议来选择最合适的一个.
技术:LabVIEW, Ruby, c++, Python, Mako, Ruby ERB, Perforce, Windows内核驱动

Web开发人员

2011 - 2012
CleanTelligent软件
  • 确定并记录了跨相关功能的多个用户体验不一致,并成功地解决了相应的问题.
  • 通过集成额外的后端查询和在前端引入新的用户界面元素,扩展了一个关键作业调度工具的功能.
  • 解决了CleanTelligent网站前端和后端的30多个bug, 提高整体性能和用户体验.
技术:JavaScript, Apache Struts 2, HTML, CSS, 雅加达服务器页面(JSP), Java, PostgreSQL, CVS, 完整的开发

课程“Scala函数式编程”的顶点项目

http://github.com/claytonlemons/fp-in-scala-capstone
这是我在Scala函数式编程课程中的顶点项目, 我开发了一个Scala/Spark项目来提取和处理全球温度数据. 我们的目标是创造互动性, 可缩放的可视化显示温度模式和偏差. 这涉及到在函数式编程方面利用Scala,以及在高效处理大型数据集方面利用Spark, 使全球气候趋势的动态和信息可视化.

NI-DCPower软前面板调试

http://www.ni.com/en-us/innovations/white-papers/14/introducing-debug-driver-session-technology.html
我开发了一个Python/ c++客户机-服务器系统,用于跨不同进程的NI-DCPower API会话的远程调试和自省. 该系统具有一个可选的服务器,由主NI-DCPower会话启动,以及一个反映会话API的客户端, 本质上是作为代理. 该系统是NI-DCPower软前面板调试功能的基础.

我通过创建一个DLL来实现这个项目,该DLL启动了一个Apache Thrift服务器,用于在本地主机上的远程和驱动程序会话之间进行命令中继, 支持调试工具的无缝集成. Thrift的灵活性是未来扩展支持非本地进程连接的关键.

我与LabVIEW和c#开发人员密切合作, 谁使用客户端API来实现NI-DCPower软前面板调试功能.

Subforce

http://github.com/claytonlemons/Subforce
在国家仪器工作期间,我创建了一个Sublime Text插件,将Perforce VCS的功能直接集成到Sublime Text中, 旨在提高团队工作流程效率. 这涉及到对Perforce和Sublime Text api的研究,以及对常见开发任务的简化. 这项工作增强了我的团队成员的开发经验, 谁更喜欢使用Sublime Text进行编码活动. 我还与Sublime Text的Package Control社区合作添加了这个插件.

GMF水上运动网站

我为GMF Aquatics开发了一个原型网站来展示和销售他们的水族产品, 利用亚马逊的商业API. 这个公益项目是为了帮助一个朋友更有效地推销他们的产品. 该网站是在后台使用CakePHP进行搭建和快速开发的. 对于前端,我使用了Bootstrap的响应式设计组合Backbone.js用于结构化web应用程序,而Mustache用于模板渲染. 这种技术的融合产生了一个简单而有效的平台,用于突出和探索水族产品.
2014 - 2016

软件工程硕士学位

德克萨斯大学奥斯汀分校位于美国德克萨斯州奥斯汀市

2007 - 2013

计算机科学学士学位

杨百翰大学-普罗沃,UT,美国

2024年2月- 2026年2月

CKS:认证Kubernetes安全专家

Linux基金会

2023年11月- 2026年11月

CKA: Kubernetes认证管理员

Linux基金会

2023年10月- 2026年10月

CKAD:认证Kubernetes应用程序开发人员

Linux基金会

2019年12月至今

Scala中的并行编程

Coursera

2019年12月至今

Scala顶点函数式编程

Coursera

2019年12月至今

Scala中的函数式编程原理

Coursera

2019年12月至今

Scala中的函数式程序设计

Coursera

2019年12月至今

使用Scala和Spark进行大数据分析

Coursera

2019年4月至今

先进的Python

LinkedIn

库/ api

TensorFlow, Keras, NumPy, SciPy, Pandas, Scikit-learn, PySpark, React, PyTorch, Ruby ERB, Backbone.. js, Mustache, Windows API

Tools

崇高文本3, Visual Studio, Gensim, Git, Perforce, GitLab, GitLab CI / CD, LabVIEW, Apache气流, Amazon EKS, Pytest, Helm, Logging, AWS步骤函数, Bitbucket, Amazon EBS, AWS ELB, AWS IAM, AWS CLI, Artifactory, Docker Hub, 码头工人组成, Google Kubernetes Engine (GKE), Terraform, CVS, ChatGPT

Platforms

Kubernetes, Docker, 亚马逊网络服务(AWS), 原生云, Windows, NetBeans, 软件设计模式, Linux, AWS Lambda, Jupyter笔记本, OCI构件注册表, Director, 谷歌云平台(GCP), Visual Studio Code (VS Code)

Frameworks

Spark, Flask, Hadoop, 雅加达服务器页面(JSP), Apache Struts 2, CakePHP, Bootstrap, Apache Thrift

Languages

Python, C++, Bash, TypeScript, PHP, CSS, Ruby, Java, Scala, GraphQL, HTML, JavaScript, Bytecode, Python 3, Embedded C, C, Bash Script, SQL, Snowflake, C#

Storage

PostgreSQL, MongoDB, 云部署, Databases, Apache Hive, 数据管道, Amazon S3 (AWS S3), Amazon EFS, 谷歌云存储, Datadog

Paradigms

函数式编程, 并发编程, 编译器设计, 分布式编程, 软件测试, 并行编程, ETL, 结对编程, 数据科学, 分布式计算, DevOps, HL7 FHIR标准, Agile, Scrum

Other

Windows内核驱动程序, 软件架构, Back-end, 机器学习, Cloud, Development, Full-stack, Firmware, API Design, 并行计算, 线程调度, Processing & Threading, 代码验证, Data Mining, 软件项目管理, 工程数据, Programming, 操作系统, 数据结构, 软件设计, Security, 非对称加密, 服务器开发, 非阻塞I / O, 自然语言处理(NLP), Compilers, 数字信号处理, 计算机工程, Algorithms, 机器学习操作(MLOps), 统计分析, CI / CD管道, Big Data, 数据分析, 数据建模, 数据概要分析, Pachyderm, APIs, Frameworks, Storage, 人工智能(AI), Code Review, Debugging, Advisory, Flake8, pre-commit, 编制, 分布式软件, Negotiation, Procurement, COTS, 企业SaaS, Provenance, 数据沿袭, IT Security, 技术领导, 功能设计, Kubernetes运营(kOps), Open Source, 集装箱编配, 故障排除, Scheduling, 站点可靠性工程(SRE), 系统管理, 集装箱化, JupyterLab, MLflow, Feast, AWS自动扩展, GPU计算, 体系结构, 单点登录(SSO), 优化, Coaching, 职业生涯辅导, 反馈评论, 软件工程, 跨职能团队领导, 战略规划 & 执行,想法综合和应用,员工管理 & Development, 目标管理, 项目协调, 业务需求, 开源llm, 大型语言模型(llm), 新产品开发, FastAPI, 跨职能的合作, Ray, Llama 2, Fine-tuning, 数据级安全, 防止数据泄露, Mako, 版本控制, 插件开发, 客户机-服务器模型, DLL, 设备驱动程序, 完整的开发, API集成, ETL Tools, 数据管理, IT Strategy, Leadership, 团队的领导, 远程团队领导, Protegrity, 检索增强生成(RAG), Chatbots

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

开始招聘