根据给定文本确定公司名称

本文关键字:公司 文本 | 更新日期: 2023-09-27 18:19:10

我有一个在股票市场领域的网站。该网站有很多用户在论坛发帖、评论等方面生成的内容。

另外,我有一个数据库表,其中包含在股票市场上市的所有公司(大约5000家)的名称。

现在,我想要的是,如果用户在评论或论坛帖子中提到公司名称,我的程序将自动超链接它,以给出它的股票价格细节。

现在,问题是用户可能不会使用确切的公司名称,因为我可以在数据库中找到它。例如,用户可能会写"FB"而不是Facebook,或者公司名称中不包含"inc"或"pvt. ltd"。

如何解决这个问题?我认为由于公司的数据库是有限的,机器学习的方法可能是多余的。你有什么建议?

根据给定文本确定公司名称

最简单的方法是为一个公司提供多种可能的存储,例如FB将与FaceBook同等处理。

这可以通过两种方式完成:

1)通过添加所有备选项来增加列表本身(5000项)。这导致了一个相当大的数据库。

2)创建一个转换列表,只有转换完成,例如FB->FaceBook等。比使用转换后,可以正常使用现有的公司数据库。这就划分了责任。

您也可以尝试只使用名称的单词部分(例如FaceBook ->FaceBook,或FaceBook ->FaceBook, xxx. inc ->xxx)。公司等).