随着互联网行业的快速发展以及开源社区、开源软件的兴起,越来越多的高质量代码可供软件开发人员选择。如何快速并准确地搜索到想要的代码,是软件工程领域中一个重要的研究方向,对软件开发以及代码重用有着重要意义。由深度神经网络模型的文本表示驱动,自然语言处理(NLP)领域在不同水平的语义理解上取得了巨大的进步。在某种意义上,由于源代码是文本数据,机器学习方法为代码搜索提供了新的思路。首先对利用机器学习方法进行代码搜索研究的分析并讨论;其次,针对多种方式结合的代码搜索方法进行展开讨论;最后指出在利用代码的统计特性上未来的几个研究方向。