首页 > 其他 > 详细

论如何快速整理文献

时间:2018-03-30 00:59:57      阅读:273      评论:0      收藏:0      [点我收藏+]

1. 粗整理:利用Windows的预览功能,筛选出那些不是文献的pdf、古老的扫描板的pdf、draft或manuscript(警告/敬告:没有发布的文献不应该被使用、整理和上传,请寻找对应的Publish版本)、supplement information、ppt、纯图片、中文文献等pdf,这些pdf文件需要手工处理有信息页的pdf可以使用工具剪切掉信息页。含有标记的pdf也需要手工寻找到对应版本的原始文件。

2.利用Mendeley工具,识别pdf文件的doi编码。注册新的Mendeley账号(很重要,不要和其他文献混了),导入pdf。之后程序开始自动寻找pdf的metadata信息,等待大约半小时。此时部分pdf的标题可能出现问题,但是只要识别出来doi就可以。无法识别而且也无法从pdf里找到doi的,归到手工处理分类。

3.对于已经可以识别出doi的pdf文献,利用Mendeley重命名文件,建议使用Journal+Year,减少长度。之后导出,建议为Endnote XML格式,随后pdf会被打包到同名文件夹下的PDF文件夹。

4. 打开Endnote X8及以上,导入XML文件,提示文件缺失。关闭Endnote,将PDF文件夹整体复制进enl对应的文件夹里,打开Endnote,应该可以识别出Attachment

5. 手工处理那些无法识别的文件,利用Google Scholar直接搜索文件名,找到对应网站,下载RIS参考信息;部分文件还需要下载原始的pdf文件。手工拖入Endnote

6.开启Endnote自动重命名功能,并批量修改文件名,建议Author+Year+Tittle,Endnote会自动缩减到50字符,如果还是太长只能自己写插件处理了。

7.整体整理Endnote库,修正一些小问题。然后对含有DOI的文档,整体使用更新参考信息,让Endnote自动搜索在线数据库更新。大约需要几个小时,静心等待,保持网络连接通常。

8.检查导入结果,手动修改一些错误地方

9.Enjoy/Read Your Paper!(RTFP)

 

参考资料

http://muchong.com/html/201501/8470739_2.html

https://www.biomart.cn/experiment/430/586/588/45434.htm

http://www.sunzx.net/archives/2171.html

 

原理:

人眼识别的Robust

Mendeley强大的PDF分析功能和背后Elsevier的数据库。特点是广泛、并由于众多用户提交的识别样本,识别率很高。单问题是信息准确度差,程序易出BUG。

Endnote就不用多解释了,直接可以查询SCI数据库,信息准确度是一流的。而且由于收费以及企业风格的软件,BUG极少,易用性很强,稳定可靠。

 

预期

使用Python+Google Scholar+selenium 抓取pdf文献的格式化信息(metadata),导入Endnote,更加高效。文件名也是个需要继续研究的问题。

Workflow

 

后续

如何高效文献?

论如何快速整理文献

原文:https://www.cnblogs.com/B1ue/p/8673305.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!