about

联系方式

  • 邮箱:wshgwork@126.com

专业技能

  • 熟练C++编程,具有动态库(DLL)开发、多线程开发的经验
  • 熟练Python编程,掌握Numpy、Sklearn、opencv等常用库使用
  • 熟悉C#编程,掌握C#基础使用,具有嵌入动态库(DLL)的经验
  • 熟悉Pytorch框架,了解Tensorflow框架
  • 熟悉数据挖掘和机器学习的基本理论及方法
  • 熟悉Oracle、SQLite数据库,了解Hadoop大数据平台,具有数据治理经验
  • 熟悉Linux系统,有至少6年的使用经验

工作经验

通用图片标注平台研发

描述:研发图片标注平台,可实现分类、分割、目标检测、OCR等模型的图片标注
负责

  1. 负责统筹整个软件的研发,包括技术路线调研、原型设计、进度管控、程序测试
  2. 负责基于C++ 开发图像处理功能,如调整图像对比度亮度、图像二值化辅助标注、数据增强等功能

技术要点:C++ 开发opencv图片处理的dll接口,使用C#开发调用dll的的样例
成果:完成3次版本迭代,支撑至少6位标注工程师的标注工作,标注数据图片超过30万张

通用模型训练平台研发

描述:研发可实现分类、分割、目标检测、OCR等模型的训练平台
负责

  1. 负责统筹整个软件的研发,包括技术路线调研、原型设计、进度管控、程序测试、模型开发
  2. 负责基于Pytorch开发分类、分割和目标检测模型
  3. 负责基于C++ 开发图像处理功能,如所有模型预测效果渲染、绘制重点学习区域

技术要点:使用Python开发Pytorch模型训练框架,使用nuitka打包训练框架,使用C++ 开发opencv图片处理的dll接口
成果:完成5次版本迭代,已输出至少2000以上个模型,支撑包括公司前后工序图片检测,如分切、模切、转接片、顶盖焊、密封钉、Mylar等工序

通用模型部署平台研发

描述:研发可实现分类、分割、目标检测、OCR等模型的部署平台
负责

  1. 负责基于TensorRT开发C++ 通用部署平台,包括模型加密解密模块,配置模块,模型的前处理、后处理模块
  2. 负责开发调用TensorRT推理的数据交换模块、多线程执行模块
  3. 负责基于C#开发部署端的离线推理版本

技术要点:C++ 开发TensoRT部署平台、C++ 的任意文件的AES加解密、C#与C++ 的数据交换、C++ 的多线程管控模型执行
成果:已在生产机台稳定运行2年,可实现CPU或GPU的部署,可以在50ms左右处理一张8K大图

大数据治理

描述:大数据治理工作近一年,期间参与了3次外出调研,2个政府项目的售前支撑和1个政府项目的驻场实施
负责:作为售前方案经理,为用户提供解决方案编写、方案实现的支撑
技术要点:数据库操作,使用Hadoop平台
成果

  • 外出调研:先后到市场监督管理局、文旅局、退役军人事务厅进行调研,完成3份项目调研报告,为公司争取项目创造有利条件
  • 售前支撑:分别参与市场监督管理局、退役军人事务厅项目的售前支撑,主要工作内容包括:了解客户需求、筛选并联系厂家,编写项目立项方案、项目预算表、项目招投标书,最终帮助部门顺利拿下这2个政府项目
  • 驻场实施:到退役军人事务厅驻场实施,主要工作内容包括:(1)协助项目经理管理5人左右的团队;(2)负责整个团队的项目文档编写(包括技术文档);(3)利用Hadoop平台对数据进行抽取、清洗、治理等

基于深度学习的肺结节区域检测

描述:首先通过分割网络(3D-UNet)对CT照片进行肺结节候选部位的提取,然后使用ResNet,Densnet等网络对候选部位进行精准识别,并给出相应概率,最后分析识别效果
负责

  1. 协助医务工作人员完成肺结节的标注;
  2. 完成使用3D-Unet分割肺结节候选部位的工作;
  3. 完成分类模型的搭建

技术要点:基于Pytorch框架的模型搭建和训练
成果:完成对肺结节的识别,并且准确率达到92%以上

研究经历

基于机器学习的抗原表位的发现

时间地点:2016年09月 - 2019年06月,广西南宁
实践描述:独立负责研发该算法
实现成果:研究生期间的主要研究工作为:结合图论及隐马尔科夫链进行网络节点的聚类,并使用支持向量机及图卷积网络进行分类,从而找到抗原上的特定位置。该项目的成果”Search for overlapping subgraphs to detect multiple epitopes from anantigene“发表到 SCI 期刊上,并在参加会议时拿到“最佳论文奖”,本人获得此次会议的”旅行奖学金“

基于深度注意模型的精准预测蛋白质二级结构算法研究

时间地点:2017年11月 - 2018年02月,广西南宁
实践描述:独立负责研发该算法
实现成果

  1. 负责收集蛋白质二级结构数据,对蛋白质二级结构的数据特性进行分析,做包括降噪,删除缺失数据和有用特征的提取等操作
  2. 负责深度学习的注意力模型的设计,搭建,编码测试,并将项目发布到Github上

基于云计算平台的下一代测序数据错误修正算法研究与实现

时间地点:2015年10月 - 2016年06月,广西南宁
实践描述:在团队中负责"数据分析处理"工作
实现成果

  1. 负责收集测序数据,并对这些数据进行包括去重,降噪和统计分析等处理,在此基础上分析多个同类软件在该数据集上的效果,最终将分析结果和自己设计的算法进行比对
  2. 综合运用R语言和Python工具,基于条形图和折线图将数据分析结果和比对结果进行可视化,支撑发表论文

在校实践

第十五届中国研究生数学建模竞赛

时间地点:2017年09月 - 2018年10月,广西南宁
实践描述:作为组长带队参加比赛
实现成果

  1. 负责统筹整个团队的工作,包括对数据进行特征筛选、根据贝叶斯定理设计模型
  2. 获得第十五届中国研究生数学建模竞赛三等奖(国家级)

第十四届中国研究生数学建模竞赛

时间地点:2017年09月 - 2017年10月,广西南宁
实践描述:作为组长带队参加比赛
实现成果

  1. 负责实现模型,使用Python、R语言,对数据进行预处理,并根据多源dijkstra算法构建模型
  2. 获得第十四届中国研究生数学建模竞赛三等奖(国家级)

大学生创业创新海外研修计划

时间地点:2015年10月 - 2015年11月,新加坡
实践描述:被学校派遣到新加坡南洋理工大学(NTU)交流学习
实现成果

  1. 在南洋理工大学(NTU)完成了关于”创业创新实践“的培训
  2. 在结束培训演示创新项目时,获得唯一一个”最佳演示奖“荣誉称号

自我评价

  • 在计算机视觉有近4年的经验
  • 责任感较强,负责的工作有头有尾
  • 拥有良好的沟通和协调能力,善于应变,能够快速适应新环境
  • 学习劲头充足,对机器学习领域新技术有浓厚的兴趣,能承受压力
  • 期待加入有活力、能成长的公司,努力为公司服务的同时,实现自己的价值提升