重复2022年6月

2022年7月11日

Citec继续在引用匹配方面做出了杰出的努力,一个月内增加了数百万。我们欢迎一些新的档案:国际公共和非营利性营销协会,Yildiz社会科学评论,政治经济学公告,西班牙国家市场和竞争委员会(CNMC),乌拉圭大学。上个月,我们计算了428,920个文件下载和1,735,689个抽象视图。我们达到了以下里程碑:
25,000,000匹配引用
1,000,000个期刊文章带有提取的参考文献
600,000篇工作论文,提取了参考文献
30,000本在线可用的书籍
30,000本书章节带引用
20,000本书


发布者如何确保他们的数据在Repec上正确

2022年7月4日

REPEC中索引的所有材料均由各自的出版商提供。他们使用Repec在1997年定义的元数据语法提供此信息,此后没有更改,除了一些添加之外。但是,遵守此语法很重要,因为错误将索引和其他问题的项目取消资格可能会导致各种问题。如果某些内容是不对的或缺少的,则每个想法或econpapers页面都有一个电子邮件联系人,以提醒维护者相关数据。

也就是说,repec以各种方式帮助维护者,以便他们可以主动解决任何问题。他们每个月都会收到各种统计数据的电子邮件,并在其“问题”页面上链接Econpapers检查器(将三个字母的存档代码添加到URL中以获取更多详细信息),其中显示了数据下载问题,检测到的语法问题以及不良URL到全文中。econpapers想法还提供常见问题解答。另外,重新阅读Intial设置说明或那些新维护者可以证明有用。

Econpapers检查器中出现的最常见问题是:

  • Repec Archive已从HTTP转移到HTTP:维护者需要更改存档模板中的URL线,并提醒Repec团队中的某人有关新位置的信息以修复下载过程。
  • 系列或期刊缺少通讯系列模板。
  • 手柄(标识符)多次使用。手柄应该唯一,永久地定义重复中的任何项目。重复使用它们是主要问题的根源。
  • 缺少合并两个字段的线结束。

无法通过自动化过程检测到其他问题。在这里,维护者需要遵循适当的约定,或检查重复站点上的视觉效果是否正确。示例是:

  • 不当使用数据字段。示例将工作纸编号放在标题中,将作者名称的隶属关系添加到标题中,或将关键字和JEL分类放入摘要中。每个信息都有自己的字段,因此可以创建适当的书目记录。
  • 每个作者都需要在自己的作者名称字段中。将它们集中在一个字段中,因此无法将作品归因于注册的作者。
  • 当某些工作有多种语言或翻译时,每个标题都将进入其自己的标题字段,而不是合并为一种。另外,对语言的提及进入了语言字段,而不是标题中。
  • 字符编码的错误导致带有有趣的角色的记录。这是通过从一个编码到具有不同编码的文件中的文件中切割和贴上字符串来进行的。带有重音(é,ñ,ü,ç,Å)的字符,连接(效果,f,ffl,æ,ß),非拉丁角色套件(西里尔,阿拉伯语)和其他特殊字符(长连字符,连字符,Windows,Windows引号,和撇号)尤其有问题。它们还使作者或引文变得更加困难。解决方案是在重复文件中单独修复这些问题,如果将它们编码为UTF-8使用,并且.Redif扩展而不是.rdf(请注意不要将两个文件都放在重复存档中,从而导致重复的把手)。
  • 不应存在​​HTML标记。重复服务和站点不可预测的结果。唯一的例外是用于抽象中的段落。同样适用于乳胶或Tex Markup。

重复2022年5月

2022年6月8日

上个月有很多庆祝活动的理由。Repec现在25岁。它达到了400万个索引研究项目。CETEC匹配算法的重写将匹配的引用参考的数量增加了8%。此外,我们欢迎一些新的Repec档案:国家知识产权机构(摩尔多瓦),智利圣地亚哥大学管理与计划研究研究所(伊朗)。我们计算了507,098个文件下载和2,000,566个抽象视图。我们达到了以下里程碑:

20,000,000匹配引用
4,000,000个索引项目
1,600,000件带有提取参考的物品
500,000个引用的工作论文


世界杯2022赛程时间表

2022年5月12日

25年前,即1997年5月12日,一些经济学家和图书馆员之间的会议为重复。2022世界杯晋级国家直播托马斯·克里切尔(Thomas Krichel)在最近的重复博客文章。随着越来越多的研究开始在网络上分享,手工索引所有这些都变得不可行。从本质上讲,一项新计划就制定了有关经济学研究出版物的元数据的规定。尽管重复享受着巨大的增长,但今天仍然适用这些规则。超过2000个出版商维护了重复档案,其中包含10,000多个串行,包括近4,000篇期刊。25年前,没有人期待那么多。

巧合的是,几天前,Repec超过了400万个索引研究项目。关于研究项目数量的演变。令人惊讶的是,稳定的增长和每一百万美元花费更少的时间。因此,并不是说有大量的研究正在等待被窃听。相反,随着Repec的普及,研究身体稳步发展。不过,它的组成随着时间而变化。Repec的目的始终是增强经济学研究的传播,而早期的最大需求是对不喜欢商业出版商的营销或网络的工作论文(预印刷)。但是很快,后者意识到他们也需要参加Repec,因为Repec成为大型和小型出版商领域传播的中心点。由于所有重复服务都是对用户,作者和出版商免费的,因此,Repec可以民主化研究的访问。

称其为核心是具有讽刺意味的,因为Repec不是集中的。该方案依赖于每个发布者在自己的FTP或网站上维护相关元数据。Repec的唯一中心方面是一个文件目录,其中包含这些分散的Repec Archives坐着的指针。所有数据都是公开的,其他服务可以利用它以任何合适的方式传播经济研究。现在,大多数传播服务,不仅是Repec.org域中的服务,都以一种或另一种方式使用Repec数据。这使得重复成为极其有效的传播工具。由于发布者负责托管内容和索引,因此它以最低的成本达到了许多用户。即使使用Repec数据运行服务也很便宜,因为全文内容仍然与发布者有关。各种赞助商照顾托管费用或托管一些服务器。

为了使事情正确,仍然有一些非货币成本。一个志愿者团队照顾新的重复档案,答案查询,监视数据质量,为参与者提供更新,并维护一些重要的重复网站。有关更多详细信息,请参阅重复的简短历史,,,,有关出版商如何参与Repec的说明,a重复档案列表,目前位于103个国家


重复2022年4月

2022年5月6日

在Repec庆祝它的前不久25岁生日,我们必须遗憾地关闭Socionet。它过去用于显示俄罗斯用户的重复数据,但遇到了法律问题。我们欢迎一些新的Repec档案:厄瓜多尔公司的监督,OMSK人道主义学院,香港科学技术大学,洛兹大学出版社,战略管理商业杂志。我们计算了493,485个文件下载和1,888,113个抽象视图。我们达到了以下里程碑:
从报告中的重复服务中的12.5万累积下载
120,000,000累计抽象观点


为什么要重复25岁?

2022年5月5日

我曾经读过一句话,声称人类从未发挥其全部潜力而永远不会发挥作用的原因是会议。有趣的是,Repec在一次会议上被“制造”。该会议于1997年5月12日举行。这被认为是Repec的生日。现在是25年前。

Repec确实从NetEC项目开始。1997年2月的帐户在我的注释中是“关于netec,特别提及Wopec”。http://openlib.org/home/krichel/hisn.html。这给了会议前的比赛状态有一个合理的想法。在某些方面,该作品是一个信息商业。它突出了JISC当时的资金扮演的角色。

它没有提到的是建立WOPEC瑞典分支机构的计划。这个想法是在伦敦的一次会议上遇到的,在那里我遇到了弗朗斯·莱特斯特斯特罗姆。他在瑞典皇家图书馆工作。我建议他们为Sune Karlsson提供资金,用于制定瑞典经济学工作文件系统的项目。
1997年1月16日,苏纳报道

“我们今天与潜在的资助者开会,并就如何做达成了初步协议。这个想法是,作为一个试点项目,我们应该将所有经济学工作论文系列在瑞典和WOPEC中。”

1997年3月,我收到了蒂尔堡大学图书馆的托马斯·W·PREPE的一封冷电子邮件。他是学位项目的技术领导者。该项目协调了荷兰大学经济学工作论文的出版。我知道这个项目。我以前曾尝试过几次与他们联系,但从未收到过他们的阅读。他建议直接以WoPec使用的内部格式为我提供数据。这是一个前所未有的行为。据我所知,直到那时,何塞·曼努埃尔·巴鲁科·克鲁兹(Jose Manuel Barrueco Cruz)(此后:JMBC),我总是必须从提供商那里获取数据并自己进行转换。但是我写道,与其充满热情接受这一报价,不如说

“在中期,我认为我们需要考虑分布式镜像存档系统的整个结构。我已经提出,我们使用列表wopec-admin@mailbase来讨论WOPEC格式的后继格式。这将允许行政元数据,系列描述符,档案描述,镜像的权限等。这是长期的努力。我将尽快发布一些反思。”

实际上,托马斯·W·普特(Thomas W.4月15日,我写信给他

“我的计划是彻底大修我们正在做的事情,我正在编写一个文档,其中包含这样做的建议。我已经向JMBC展示了一份草稿,他认为目前尚不清楚……这被称为吉尔福德协议。”

托马斯·W·普特(Thomas W.Sune表示偏爱5月12日。他使用了瑞典项目中的旅行资金,并在我位于吉尔福德的烈士法院的公寓里冲浪。苏纳于16:00大约在8日到达。我们出去散步到圣玛莎山。在远足上,我向他提出了问题。他如何看待我的草稿?当他透露他认为他们是合理的时,我感到非常放心。

这样的会议相当顺利。与会者是Corry Stuyts,他是JMBC,Sune,Thomas和我本人的学位负责人。我的办公室太小了,里面有太多的计算机,所以我们在大卫·霍登(David Hawden)的办公室遇到了走廊。我们基本上设置并通过我准备的文件进行工作。这就是我们所做的。我们没有完成它们。托马斯和科里不得不提早离开。我们通过我准备的两个文件进行了很好的细节。他们是重新规范和吉尔福德协议。这两个文件仍然是重复的基础。SUNE在5月16日做出了重要的更正。

Repec是一项基层倡议。通常,基层倡议需要一些时间才能成长。因此,此类计划的确切开始并不容易解决。1997年5月12日的日期通常被接受为repec的生日。但是25年后,我们需要新的方向。我有想法,但不幸的是,我目前被资助用于其他业务。


重复2022年3月

2022年4月4日

在过去的一个月中,我们计算了532,252个文件下载和2,018,681个抽象视图。我们欢迎以下新的Repec档案:经济增长研究所,国际存款保险公司协会,阿根廷教皇天主教大学,普拉斯堡经济中心有限公司,利比特斯国际大学。我们到达了:

3,600,000个物品在线提供
2,000,000篇摘要
70,000本章节在线可用


repec介绍了NFT注册的学术论文注册

2022年4月1日

Repec中的每个项目(论文,文章等)都通过独特而持久的手柄来确定,并且已经25年了。尽管如此,仍然需要对其他持久标识符的需求,例如,请参见DOI的引入。但是,这些标识符都没有清楚地表明该项目的所有者是谁。Repec现在介绍了一种通过利用区块链技术来解决此问题的方法。不可杀死的令牌(NFT)是存储在区块链上的数据单位,该单位是一种数字分类帐的形式(一种形式)(维基百科)。

作者可以通过指定相关的repec句柄来为其文章创建区块链(NFT)的记录。然后,他们可以在repec作者服务并在相应的项目中注册NFT。为此,在网站上创建了一个新的NFT部分。他们只需要找到该代币适用的工作,然后通过菜单添加它。

作者需要注意一定的局限性:

  1. 重复注册不是钱包。尽管注册令牌被检查针对其区块链,但它不是所有权的证明。作者仍然需要一个加密钱包来安全地存储令牌。
  2. 注册是先到先得的,从某种意义上说,如果合着者已经注册了一个代币以供repec句柄,则无法添加其他。
  3. 有很多区块链,新的区块链不断创建。Repec表格填充了50个流行的区块链,但可以在自由文本中添加另一个。
  4. 请记住,在一个区块链上有一个令牌并不能阻止某人在另一个区块链上获得同一repec手柄的令牌。因此,需要在几个区块链上固定NFT。一个人可以从几个区块链中重复将令牌注册以进行同一手柄。
  5. 注册令牌仅适用于repec句柄。实际的全文仍然与相关的出版商保持着适当的权利。
  6. 重复手柄是由出版商创建的,将其作品索引在Repec中。他们可以自由删除那些手柄。

如果这对您没有意义,请放心,它可以起作用。


重复2022年2月

2022年3月7日

2月的新repec档案:卡尔顿学院和学术出版小组。我们计算了432,263个文件下载和1,649,255个抽象视图。最后,我们达到的里程碑:
8,000,000累积书籍章节摘要观点
900,000摘要的工作文件
64,000名注册作者
30,000 Covid-19相关研究项目


重复发布者数据如何传播

2022年3月3日

Repec的使命是关于经济学研究的传播。出版商(商业,非营利,学术或政策机构)向元数据提供有关其出版物的元数据,然后重复“照顾它”。如何?

基本上,repec使数据可用,然后在其他数据上可以使用该数据构建面向用户的服务。这些服务中的一些通过增强数据并彼此之间进行交换来相互协作。可以通过在repec.org域中确定这些,例如econpapers,,,,想法,,,,NEP,,,,repec作者服务等等。这些特别的交换用法数据可以通过logec

但是还有更多。重复数据由许多其他站点利用。虽然未报告所得的使用和流量,因此我们不知道那里使用了多少重复数据,但这些其他站点正在为Repec的研究传播任务做出贡献。举一些示例:Econlit和EBSCO使用重复数据作为工作论文,Google Scholar和OrcID从Repec的数据转储开始。有些求助于刮擦重复网站而不是使用原始数据(这是免费提供),例如Researchgate以及针对研究人员的无数新站点。

最后,这就是全部内容:出版商在一个地方将其出版物索引,从那里开始广泛传播。这就是重复的全部内容。