Resum& # 233;在.net框架中使用自然语言处理进行解析

本文关键字:自然语言处理 框架 net Resum | 更新日期: 2023-09-27 18:11:44

我正在比较两份简历。我有一个标准,如果某些字段匹配它是一个重复。你可能知道,简历的风格各不相同。我如何理解name字段是一个名称字段,以便我可以将其存储在某个地方,并将其与另一个简历中的相同字段进行比较?

到目前为止,我已经使用了一个互操作方法,我正在一个字符串中获取所有文档内容。从字符串中,我对所有的't, 'r和空格进行拆分,得到一个数组。从数组中,我如何获得自己的标准xml格式,如下所示:

XML格式:

 <CANDIDATE_FULL_NAME>CandidateName here</CANDIDATE_FULL_NAME>
 <CANDIDATE_FIRST_NAME>CandidateFirstName here</CANDIDATE_FIRST_NAME>
 <CANDIDATE_LAST_NAME>CandidateLastName here</CANDIDATE_LAST_NAME>
 <PRIMARY_EMAI`enter code here`L_ID>name@gmail.com</PRIMARY_EMAIL_ID>
 <PHONE_BASIC>+919720018454155</PHONE_`enter code here`BASIC>
 <DOB>8/2/1987</DOB>
 <STREET1></STREET1>
 <STREET2></STREET2>
 <CITY></CITY>
 <REGION></REGION>
 <COUNTRY></COUNTRY>
 <PIN></PIN>

在回顾了我的问题之后,我很明显不知道自己在做什么,如果能给我一个起点就太好了。

Resum& # 233;在.net框架中使用自然语言处理进行解析

甘尼什,我建议你建立自己的逻辑。以下是你可以使用的:

  1. 将所有简历按字段划分。
  2. 然后您可以为每个字段指定weight-age,如。

    <>之前电邮- 80电话- 80姓名- 20最高学历- 20家乡- 20上一家公司——20家Dob - 30和其他人
  3. 然后将数字相加,看看它们的总和是否大于或等于80。
  4. 如果超过,那么你可以说它的简历相同。
  5. 挑战是有多少字段,以及如何分割它们。我建议使用一些简历解析器,并在此基础上构建逻辑。