Resum& # 233;在.net框架中使用自然语言处理进行解析
本文关键字:自然语言处理 框架 net Resum | 更新日期: 2023-09-27 18:11:44
我正在比较两份简历。我有一个标准,如果某些字段匹配它是一个重复。你可能知道,简历的风格各不相同。我如何理解name字段是一个名称字段,以便我可以将其存储在某个地方,并将其与另一个简历中的相同字段进行比较?
到目前为止,我已经使用了一个互操作方法,我正在一个字符串中获取所有文档内容。从字符串中,我对所有的't, 'r和空格进行拆分,得到一个数组。从数组中,我如何获得自己的标准xml格式,如下所示:
XML格式:
<CANDIDATE_FULL_NAME>CandidateName here</CANDIDATE_FULL_NAME>
<CANDIDATE_FIRST_NAME>CandidateFirstName here</CANDIDATE_FIRST_NAME>
<CANDIDATE_LAST_NAME>CandidateLastName here</CANDIDATE_LAST_NAME>
<PRIMARY_EMAI`enter code here`L_ID>name@gmail.com</PRIMARY_EMAIL_ID>
<PHONE_BASIC>+919720018454155</PHONE_`enter code here`BASIC>
<DOB>8/2/1987</DOB>
<STREET1></STREET1>
<STREET2></STREET2>
<CITY></CITY>
<REGION></REGION>
<COUNTRY></COUNTRY>
<PIN></PIN>
在回顾了我的问题之后,我很明显不知道自己在做什么,如果能给我一个起点就太好了。
甘尼什,我建议你建立自己的逻辑。以下是你可以使用的:
- 将所有简历按字段划分。
-
然后您可以为每个字段指定weight-age,如。
<>之前电邮- 80电话- 80姓名- 20最高学历- 20家乡- 20上一家公司——20家Dob - 30和其他人 - 然后将数字相加,看看它们的总和是否大于或等于80。
- 如果超过,那么你可以说它的简历相同。
- 挑战是有多少字段,以及如何分割它们。我建议使用一些简历解析器,并在此基础上构建逻辑。