about

联系方式

  • 邮箱:wshgwork@126.com

专业技能

  • 熟练 C++ 编程,具有动态库 (DLL) 开发、多线程开发的经验
  • 熟练 Python 编程,掌握 Numpy、Sklearn、opencv 等常用库使用
  • 熟悉 C# 编程,掌握 C# 基础使用,具有嵌入动态库 (DLL) 的经验
  • 熟悉 Pytorch 框架,了解 Tensorflow 框架
  • 熟悉数据挖掘和机器学习的基本理论及方法
  • 熟悉 Oracle、SQLite 数据库,了解 Hadoop 大数据平台,具有数据治理经验
  • 熟悉 Linux 系统,有至少 6 年的使用经验

工作经验

通用图片标注平台研发

描述:研发图片标注平台,可实现分类、分割、目标检测、OCR 等模型的图片标注
负责

  1. 负责统筹整个软件的研发,包括技术路线调研、原型设计、进度管控、程序测试
  2. 负责基于 C++ 开发图像处理功能,如调整图像对比度亮度、图像二值化辅助标注、数据增强等功能

技术要点:C++ 开发 opencv 图片处理的 dll 接口,使用 C# 开发调用 dll 的的样例
成果:完成 3 次版本迭代,支撑至少 6 位标注工程师的标注工作,标注数据图片超过 30 万张

通用模型训练平台研发

描述:研发可实现分类、分割、目标检测、OCR 等模型的训练平台
负责

  1. 负责统筹整个软件的研发,包括技术路线调研、原型设计、进度管控、程序测试、模型开发
  2. 负责基于 Pytorch 开发分类、分割和目标检测模型
  3. 负责基于 C++ 开发图像处理功能,如所有模型预测效果渲染、绘制重点学习区域

技术要点:使用 Python 开发 Pytorch 模型训练框架,使用 nuitka 打包训练框架,使用 C++ 开发 opencv 图片处理的 dll 接口
成果:完成 5 次版本迭代,已输出至少 2000 以上个模型,支撑包括公司前后工序图片检测,如分切、模切、转接片、顶盖焊、密封钉、Mylar 等工序

通用模型部署平台研发

描述:研发可实现分类、分割、目标检测、OCR 等模型的部署平台
负责

  1. 负责基于 TensorRT 开发 C++ 通用部署平台,包括模型加密解密模块,配置模块,模型的前处理、后处理模块
  2. 负责开发调用 TensorRT 推理的数据交换模块、多线程执行模块
  3. 负责基于 C# 开发部署端的离线推理版本

技术要点:C++ 开发 TensoRT 部署平台、C++ 的任意文件的 AES 加解密、C# 与 C++ 的数据交换、C++ 的多线程管控模型执行
成果:已在生产机台稳定运行 2 年,可实现 CPU 或 GPU 的部署,可以在 50ms 左右处理一张 8K 大图

大数据治理

描述:大数据治理工作近一年,期间参与了 3 次外出调研,2 个政府项目的售前支撑和 1 个政府项目的驻场实施
负责:作为售前方案经理,为用户提供解决方案编写、方案实现的支撑
技术要点:数据库操作,使用 Hadoop 平台
成果

  • 外出调研:先后到市场监督管理局、文旅局、退役军人事务厅进行调研,完成 3 份项目调研报告,为公司争取项目创造有利条件
  • 售前支撑:分别参与市场监督管理局、退役军人事务厅项目的售前支撑,主要工作内容包括:了解客户需求、筛选并联系厂家,编写项目立项方案、项目预算表、项目招投标书,最终帮助部门顺利拿下这 2 个政府项目
  • 驻场实施:到退役军人事务厅驻场实施,主要工作内容包括:(1)协助项目经理管理 5 人左右的团队;(2)负责整个团队的项目文档编写(包括技术文档);(3)利用 Hadoop 平台对数据进行抽取、清洗、治理等

基于深度学习的肺结节区域检测

描述:首先通过分割网络(3D-UNet)对 CT 照片进行肺结节候选部位的提取,然后使用 ResNet,Densnet 等网络对候选部位进行精准识别,并给出相应概率,最后分析识别效果
负责

  1. 协助医务工作人员完成肺结节的标注;
  2. 完成使用 3D-Unet 分割肺结节候选部位的工作;
  3. 完成分类模型的搭建

技术要点:基于 Pytorch 框架的模型搭建和训练
成果:完成对肺结节的识别,并且准确率达到 92% 以上

研究经历

基于机器学习的抗原表位的发现

时间地点:2016 年 09 月 - 2019 年 06 月,广西南宁
实践描述:独立负责研发该算法
实现成果:研究生期间的主要研究工作为:结合图论及隐马尔科夫链进行网络节点的聚类,并使用支持向量机及图卷积网络进行分类,从而找到抗原上的特定位置。该项目的成果”Search for overlapping subgraphs to detect multiple epitopes from anantigene“发表到 SCI 期刊上,并在参加会议时拿到 “最佳论文奖”,本人获得此次会议的” 旅行奖学金 “

基于深度注意模型的精准预测蛋白质二级结构算法研究

时间地点:2017 年 11 月 - 2018 年 02 月,广西南宁
实践描述:独立负责研发该算法
实现成果

  1. 负责收集蛋白质二级结构数据,对蛋白质二级结构的数据特性进行分析,做包括降噪,删除缺失数据和有用特征的提取等操作
  2. 负责深度学习的注意力模型的设计,搭建,编码测试,并将项目发布到 Github 上

基于云计算平台的下一代测序数据错误修正算法研究与实现

时间地点:2015 年 10 月 - 2016 年 06 月,广西南宁
实践描述:在团队中负责 "数据分析处理" 工作
实现成果

  1. 负责收集测序数据,并对这些数据进行包括去重,降噪和统计分析等处理,在此基础上分析多个同类软件在该数据集上的效果,最终将分析结果和自己设计的算法进行比对
  2. 综合运用 R 语言和 Python 工具,基于条形图和折线图将数据分析结果和比对结果进行可视化,支撑发表论文

在校实践

第十五届中国研究生数学建模竞赛

时间地点:2017 年 09 月 - 2018 年 10 月,广西南宁
实践描述:作为组长带队参加比赛
实现成果

  1. 负责统筹整个团队的工作,包括对数据进行特征筛选、根据贝叶斯定理设计模型
  2. 获得第十五届中国研究生数学建模竞赛三等奖(国家级)

第十四届中国研究生数学建模竞赛

时间地点:2017 年 09 月 - 2017 年 10 月,广西南宁
实践描述:作为组长带队参加比赛
实现成果

  1. 负责实现模型,使用 Python、R 语言,对数据进行预处理,并根据多源 dijkstra 算法构建模型
  2. 获得第十四届中国研究生数学建模竞赛三等奖(国家级)

大学生创业创新海外研修计划

时间地点:2015 年 10 月 - 2015 年 11 月,新加坡
实践描述:被学校派遣到新加坡南洋理工大学 (NTU) 交流学习
实现成果

  1. 在南洋理工大学 (NTU) 完成了关于” 创业创新实践 “的培训
  2. 在结束培训演示创新项目时,获得唯一一个” 最佳演示奖 “荣誉称号

自我评价

  • 在计算机视觉有近 4 年的经验
  • 责任感较强,负责的工作有头有尾
  • 拥有良好的沟通和协调能力,善于应变,能够快速适应新环境
  • 学习劲头充足,对机器学习领域新技术有浓厚的兴趣,能承受压力
  • 期待加入有活力、能成长的公司,努力为公司服务的同时,实现自己的价值提升