Who's Studio.

实习经历 - MSRA

Word count: 279Reading time: 1 min
2016/09/06

时间

2015年6月 - 2016年3月

公司

北京微软亚洲研究院

项目

CodeHow,一个自然语言查询的代码搜索引擎。

具体工作

CodeHow是一个用于自然语言查询的代码搜索工具。目前支持C#、C++、Java、JavaScript。同时它还可用于Api Example查询。
前端采用MVC框架,负责接收用户输入并与后台搜索引擎交互。
后台采用Elasticsearch以及Sql Server。其中基于自然语言搜索的代码库使用elasticsearch,而Api Example部分的代码库使用sql server。
代码库源代码收集:Nodejs脚本编写的github爬虫。
代码库源代码AST分析:C#和VB采用Roslyn以及Nuget,Java采用jdk,C++采用Clang,JavaScript采用esprima
部分研究工作:通过NLP领域的词向量提取方法(如流行的word2vec)尝试提取软件工程领域的同义词,并应用到代码搜索上以提高搜索精度。

语言技术

语言:C#,Java,Javascript
技术:MVC,AST分析,信息检索,自然语言处理 ##开发及同步工具 开发:Visual Studio 2015/eclipse/sublime 同步:git

CATALOG
  1. 1. 时间
  2. 2. 公司
  3. 3. 项目
  4. 4. 具体工作
  5. 5. 语言技术