cv
个人简历
- 大连理工大学计算机科学与技术学院,硕士研究生
- 邮箱:bcyyl@foxmail.com
- 地址:辽宁省大连市甘井子区凌工路2号大连理工大学
- Github:https://github.com/Xls1994
研究方向: 信息抽取、表示学习
教育背景
- 2015.09~2018.07 大连理工大学 计算机科学与技术专业 工学硕士
- 2011.09~2015.07 烟台大学 计算机科学与技术专业 工学学士
科研经历
2016.12-至今 融合知识表示的疾病药物关系抽取研究
- 利用TransE等翻译表示学习模型和CNN模型进行结合,抽取知识库中的三元组信息,利用Attention机制融合三元组中的关系信息和实例句子的语义信息,分别关注词级别和短语级别的特征,构建有知识的深度神经网络。
- 构建融合语义信息和句法结构信息的CNN模型,进行疾病药物关系抽取。分别探究了一个k-max CNN模型 抽取语义信息,利用两个加权的CNN模型抽取扩展的上下文句子中的语义信息,利用一个CNN模型抽取最短依存路径树的句法结构信息,然后进行模型融合。相关论文已经投递至CCL &NLP-NABD 2017。
2016.06-2016.12 表示学习研究
- 基于双语词向量,通过构建情感和语义联合学习的LSTM模型用于跨语言情感分析。不同的词在同一个句子中表示的情感有所差异,而同样的词在不同的句子中也可能表示不同的情感。基于这个思想,该模型可以通过句子级别的情感表示和词表示进行联合学习,获取不同句子下的情感和语义信息然后进行情感分析。相关论文发表在CCIR 2017。
- 利用同义词词林和大规模无标注语料分别学习中文多义词词义向量,在中文多义词评测的数据集上取得了最新的成果。相关论文发表在CCIR 2017。
2016.02-2016.06 基于翻译学习和核方法的中文模糊限制信息检测研究
- 国家自然科学基金项目(No.61272375,已经结题)抽取生物医学文本中模糊限制语及其模糊限制信息范围,构建基于模糊限制语上下文和候选短语序列的LSTM模型,用于中文模糊限制信息范围检测。相关论文发表在CCL&NLP-NABD 2016上,并进行海报展示。
- 申请两项国家专利,目前专利已经进入公示阶段
- 获得软件著作权三项
2015.09-2015.12 生物医学疾病与药物关系抽取研究
- 构建基于LSTM和CNN的深度学习模型,用于提取词序列和句法结构树中蕴含的深层语义信息
- 最终,构建了平面特征、句法结构和语义三者结合的混合模型,在BioCreative V CDR 任务中,有效的证明了这三者的有效性,而且他们的有机组合能够 提升系统性能。相关论文发表在生物医学SCI期刊DataBase。
发表论文
- Huiwei Zhou, Yunlong Yang, Zhuang Liu, Yingyu Lin, Pengfei Zhu, Degen Huang. Jointly Learning Bilingual Sentiment and Semantic Representations for Cross-language Sentiment Classification. CCIR 2017.
- Huiwei Zhou, Chen Jia, Yunlong Yang, Shixian Ning, Yingyu Lin, Degen Huang. Combining Large-scale Unlabeled Corpus and Lexicon for Chinese Polysemous Word Similarity Computation. CCIR 2017.
- Huiwei Zhou, Junli Xu, Yunlong Yang, Huijie Deng, Long Chen, Degen Huang. Chinese hedge scope detection based on structure and semantic information. Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data (CCL&NLP-NABD 2016) pdf slides
- Huiwei Zhou, Huijie Deng, Long Chen,Yunlong Yang,Chen Jia, Degen Huang. Exploiting syntactic and semantics information for chemical-disease relation extraction[J]. Database the Journal of Biological Databases & Curation, 2016, 2016:baw048. pdf
专业技能
- 熟练使用Python、Java编写程序,熟悉常见深度学习框架例如Keras、TensorFlow、Theano等。
- Linux下深度学习TensorFlow、Theano等相关框架的搭建.
- 熟悉自然语言处理 (NLP) 的基本方法,以及常用深度学习模型例如CNN、LSTM、Memory Network等
- 掌握数据结构、算法等理论基础,具有良好的数学基础
- 具有良好的英文读写能力,能够熟练阅读和分析英文文献
实践经历
2016.09-2016.12 大连理工大学盘锦校区人工智能助教 :负责指导学生上机、答疑、批阅作业
项目经历
Github开源项目:
基于Keras的char-CNN、NER、Word Segment、Memory Network、Regression
TensorFlow示例代码,CNN、RNN