Resum& # 233;在.net框架中使用自然语言处理进行解析

本文关键字：自然语言处理框架 net Resum | 更新日期: 2023-09-27 18:11:44

我正在比较两份简历。我有一个标准，如果某些字段匹配它是一个重复。你可能知道，简历的风格各不相同。我如何理解name字段是一个名称字段，以便我可以将其存储在某个地方，并将其与另一个简历中的相同字段进行比较?

到目前为止，我已经使用了一个互操作方法，我正在一个字符串中获取所有文档内容。从字符串中，我对所有的't， 'r和空格进行拆分，得到一个数组。从数组中，我如何获得自己的标准xml格式，如下所示:

XML格式:

 <CANDIDATE_FULL_NAME>CandidateName here</CANDIDATE_FULL_NAME>
 <CANDIDATE_FIRST_NAME>CandidateFirstName here</CANDIDATE_FIRST_NAME>
 <CANDIDATE_LAST_NAME>CandidateLastName here</CANDIDATE_LAST_NAME>
 <PRIMARY_EMAI`enter code here`L_ID>name@gmail.com</PRIMARY_EMAIL_ID>
 <PHONE_BASIC>+919720018454155</PHONE_`enter code here`BASIC>
 <DOB>8/2/1987</DOB>
 <STREET1></STREET1>
 <STREET2></STREET2>
 <CITY></CITY>
 <REGION></REGION>
 <COUNTRY></COUNTRY>
 <PIN></PIN>

在回顾了我的问题之后，我很明显不知道自己在做什么，如果能给我一个起点就太好了。

Resum& # 233;在.net框架中使用自然语言处理进行解析

甘尼什，我建议你建立自己的逻辑。以下是你可以使用的:

将所有简历按字段划分。
然后您可以为每个字段指定weight-age，如。
<>之前电邮- 80电话- 80姓名- 20最高学历- 20家乡- 20上一家公司——20家Dob - 30和其他人
然后将数字相加，看看它们的总和是否大于或等于80。
如果超过，那么你可以说它的简历相同。
挑战是有多少字段，以及如何分割它们。我建议使用一些简历解析器，并在此基础上构建逻辑。