我從專家那裡聽到很多信息,引用數量作為判斷論文的一種好方法。這似乎對我來說是違反直覺的。我想知道是否已經朝這個方向進行了研究?
我從專家那裡聽到很多信息,引用數量作為判斷論文的一種好方法。這似乎對我來說是違反直覺的。我想知道是否已經朝這個方向進行了研究?
我不知道該領域的任何研究,但我有一種直覺,即以下幾點適用(沒有任何特定順序,在評論/回复時為方便起見僅作編號):
引用計數是受 Matthew效應約束的現象的一個很好的例子:這是一種反饋過程,其中特權人員由於特權而變得更有特權。當然,質量確實與紙質圖紙的引用有很大關係。它的引文也受到作者的聲望,場地聲望的影響,也受其他人援引該論文的事實的強烈影響(因此使喜歡自己的人將其視為“更高質量”,因此更多)可能會引用它)。同樣,僅紙張模糊不清的事實並不意味著它是不好的。通常,它只是意味著沒有人關注它。最後,人們對結果感到滿意的事實並不一定使它成為現實,因為思想上的許多科學變化(更不用說醜聞)都可以證明;
引文計數仍然是獲得人們對哪些論文重要的第一印象的好方法,但是對於其他人來說,這是一個很好的第一印象。作為科學家,您真的需要自己判斷質量。
它僅在特定條件下起作用。
實際上,有一個整個研究領域通過出版指標探索科學過程,這被稱為 文獻計量學。確實,有時在字段內的引用次數被用作評估文章質量的代理。例如,請參見最近發表的有關同行評議的研究:
Siler K,Lee K,Bero L(2015)衡量科學管理的有效性 PNAS 1月13日; 112(2) :360-5。 doi:10.1073 / pnas.1418218112
從中復制以下突出顯示的段落。
首先,給出將引用計數視為質量度量的原因(我編輯了引用以匹配本文底部給出的引用):
科學家出於各種原因(1、2)引用工作。但是,絕大多數引用本質上是肯定的或中性的(3)。我們假設科學家喜歡在自己的工作基礎上進行其他質量研究。正如拉圖爾和伍爾加(Latour and Woolgar,4)所暗示的那樣,引用是一種尊重行為,也是智力和內容在科學中流動的手段。與此相關的是,我們還假設大多數科學家都希望進行高質量的研究,並且很少嘗試通過公然從事不良工作來贏得信譽和關注。因此,總的來說,與引文相關的注意力和影響提供了合理的質量度量。引用提供了客觀和定量的科學信譽和關注流度量。
的論點,他們還討論了使用引用作為質量度量的局限性, strong>引文的對數分佈:
由於引文通常呈指數分佈,有幾篇文章引起了不成比例的關注(5),因此我們也使用了 引用對數被視為因變量,以減少一些被高度引用的離群文章的潛在影響
和“社會地位”效應:
科學家經常依靠啟發法來判斷質量;學者,機構和期刊的地位是這樣做的常見手段(6、7)。毫不奇怪,手稿收到的引文與最終發表該期刊的期刊的影響因子呈正相關。
簡而言之,比較期刊上發表的文章的引文計數具有非常不同的影響
參考編號3的第46頁和第47頁給出了引文計數限制的詳盡列表,以作為質量的代名詞(為簡潔起見,我編輯了該列表):
- 與時間有關的因素由於科學產出的指數級增長,被引用的可能性逐年增加。
- 領域相關因素科學與社會科學領域甚至單個子領域的不同區域(或集群)內的引文做法都不同。 ,相比於一般領域[..],小領域所吸引的引用要少得多。
- 與期刊有關的因素 [...]期刊可訪問性,可見性和國際性[...] ]以及期刊的影響力,質量或聲譽可能會影響被引用的可能性。
與文章相關的因素 [...]出版物的引用頻率與該作品的合著者數量之間呈正相關。而且,與較短的文章相比,較長的文章具有更多可以引用的內容,因此文章的絕對大小會影響是否引用[...]。
與作者/讀者相關的因素 [...]撰寫論文所用的語言會影響被引用的可能性。 [...]引用受到社交網絡的影響:作者主要引用與他們個人相識的作者的作品。 [...]男人收到的工作引用比女人多得多。
該網站的許多常規用戶都喜歡: >
- 出版物的可用性物理可訪問性,出版物的免費在線可用性[...]和出版媒體[...]
最後:
- 技術問題 [...]不幸的是,錯誤引用來源並非罕見:Evans等。 (...] [...] [...] [...] Eichorn和Yankauer(1987)發現“ 150個參考文獻中有31%出現了引文錯誤,十分之一是主要錯誤(參考文獻無法定位)” [...]此外,同形異義詞和同義詞可能引起問題在研究出版物並使用作者姓名從引用數據庫中獲取引用時。
所有這些都與大量引用相關,您可以在可下載的原始文檔中找到這些引用。
Lynn FB(2014)通過學科傳播:內部人員,局外人和受社會影響的引用行為。 Soc Forces 93(1):355–382。
Hargens LL(2000)使用文獻:參考網絡,參考背景和學術的社會結構。 Am Sociol Rev 65(6) :846–865。
Bornmann L,Daniel H-D(2008)引文計數能衡量什麼:對引用行為的研究綜述。 J Doc 64(1):45–80。
Latour B,伍爾加斯(Woolgar S)(1979年)實驗室生活:科學事實的構建(洛杉磯,塞奇)。
Lotka AJ(1926)科學生產力的頻率分佈。 J Wash Acad Sci 16:317–323。
Long JS,Fox MF(1995年)科學職業:普世主義和特殊主義。 Annu Rev Sociol 24:45–71。
李CJ,杉本CR,Zhang G,Cronin B(2013)《同行評議中的偏見》。 JASIST 64(1):2–17。
首先,不要過於相信概括。到目前為止,引用次數並不是一個完美的衡量標準。首先,更多的引用需要花費更多的時間來積累,一次可能要查看每年的引用或類似的引用。其次,可以引用您自己的作品,這樣就不會過濾掉 self-citations (自我引用),您可能會看到虛高的值。自我引用本身並不一定一定是邪惡的,有很多原因導致人們必須引用自己的早期著作。一個明顯的原因是,以後的工作通常建立在早期的工作之上,而部分工作通常是同一個人的早期工作。第三,引文的數量取決於領域,在文獻計量學中,存在消除此類偏差的方法。因此,在一個很小的領域中,無論是多麼出色,在熱門話題上進行大量研究的文章都會比在這篇文章中獲得更多的點擊率。頭腦中的問題,而不是過度解釋。從本質上說,這與對任何數據集的任何常規方法都沒有什麼不同。
引文數量對判斷紙張質量不利的原因是,有很多原因(15、28、26-取決於研究)被引證,不同學科之間的引文實踐也有所不同。請參閱:
案例,D O & Higgins,GM 2000年,我們如何調查引用行為?傳播中引用文獻的原因研究。 JASIS 51(7)635-645
供較早的研究參考和有關傳播學科的研究報告。
其他人也提到過,但值得重複-引用不一定是肯定的。大量論文使用錯誤的方法,並被引用為不做什麼的例子。
此外,至少在社會科學領域,引用與年齡和“先發優勢”相關。 '。因為任何有價值的學術論文都會引用文獻綜述中有關該主題的先前工作,所以較早的論文自然會獲得更高的引文計數,而其他所有論文則保持不變。這與那些論文的質量沒有多大關係。
首先,更好意味著什麼?
我知道這聽起來像是在挑剔,但我可以提供一個示例,在引文和某種特定的更好之間給出強烈的負相關性。我通常為研究編寫算法。一般來說,除非您的算法在某種程度上比以前的算法有所改進,否則您就無法發布。但是您當然需要引用以前發布的算法!因此,對於給定的問題,早期的算法將具有大量引用,而後期的算法將具有較少引用。
因此,如果您對“更好”的定義是算法更快(一個非常合理的定義),那麼被大量引用的論文可能是文獻中最差的(因為它們是最老的)。
作為軼事,我剛剛發表了一篇關於算法的論文,我有理由相信它將關閉針對該特定問題的優化書(部分是因為它確實非常快,部分是因為它不是很熱門)話題)。因此,即使與同一個問題上的先前算法相比,我也不希望該論文被引用。
這個問題有很多好的答案,但是我想對我認為最重要的觀點進行闡述。
引用次數是衡量影響而非質量:文章的引用次數是對研究影響而非質量的衡量。即使作為衡量研究影響的指標,它也存在問題,但總的來說,“研究影響”更接近於它所代表的含義。高質量的新論文被引用的次數最少,因為它幾乎沒有時間產生影響。同樣,論文的質量與研究的影響只是鬆散相關。一些高質量的論文很難被文獻消化。一些低質量的論文演變成標准出版物,通常在給定的背景下被引用。整個文獻可能使用有問題的方法,但建立了一個相互補充的引文的整個生態系統。
引文計數自出版以來就因時間而混淆:最大的要點之一是: citation_count = average_citations_per_year x years_since_publication
發布以來的時間與質量無關,但它是文章引用計數的主要驅動因素之一。因此,即使您確實將引文視為質量指標,但每年的平均引文比總引文更好。即使到了那兒,它也會變得很複雜,因為給定領域中的文章往往會隨著時間的流逝而具有總體分佈,例如,每年的引用量通常會趨於早達到峰值,然後隨時間逐漸下降。因此,如果您嘗試基於引文獲得純的質量度量,則可能會根據經過了多少年和已知的引文分佈特徵來估算30年或更長時間後的預期引文數。
其他各點:
雖然大多數答案都指出了引用次數的問題,但值得一視同仁。發布5或10年後,每年的平均引用次數可以提供一些信息關於出版物的質量。實際上,這是衡量潛在影響力的指標,它是在有限的時間內完成的影響所確定的指標,雖然不是確定的,但它是有用的信息。如果您要評估質量,則您或其他合適的技術人員都需要閱讀並評估本文。
特別是,如果五年或十年後,一篇文章幾乎沒有被引用,那麼這對於論文的質量來說是一個危險信號。同樣,如果一篇文章每年被引用數百次,則表明它可能是一項重要的工作。這些都不是確定的,但它是提示性和有用的信息。
1994年,在醫學雜誌上發表了一篇名為《確定葡萄糖耐量和其他代謝曲線下總面積的數學模型》的論文,其中描述了一種計算曲線下面積的方法,被稱為“泰式方法”。根據Google學術搜索,該論文獲得了311條引用,這對醫學論文來說顯然還不錯(儘管有些文章實際上可以獲得1000條引用...)。
此方法是梯形法則,根據維基百科,古代巴比倫人在公元前50年就知道了它。每位接受過模糊數學教育的大學生,也許是高中生,或者是閱讀流行數學博客的人,都知道這一點。
僅從看這篇論文的引文就不會知道這種瘋狂。 。在其他答案中有很多很好的論據,但是如果這還不足以使您審慎地查看引文計數,我不知道會怎樣。
我認為可以歸結為以下問題:
您是將引文用作度量 還是作為度量。
度量是通過測量一個量(例如,英里,秒,引文,單詞)獲得的值。度量是主要的客觀屬性。 度量沒有任何意義,只是一個量化。
度量通常使用多個度量並組合他們。組合後,可以使用 metric 並將其與一組規則或其他 metered 對象進行比較,以便對其進行排序或估價。度量的組合是a)含義和b)主觀性進入整個過程的步驟。
因此使用引用作為度量是絕對可以理解的,但是您很可能永遠不會將引用本身用作度量。當引用次數用作衡量紙張質量的指標時,需要做出無法證明的假設(除了通過測量其他方法也可以)。
僅因為可以測量某些內容並不意味著該度量包含任何信息。
Doe,Umanskaya,Milton和Bennt在[DUMB 1999]中提出,根據論文的引用次數評估論文確實是可以接受的,並且他們的論文被引用了5,000多個,因此我們可以相信他們的說法。
人類,不論智力水平如何,通常傾向於“群居心理”。我想這是因為我們像其他動物一樣,希望節約能源。例如,如果每個人都認為斯蒂芬·霍金或麗莎·蘭德爾很少犯錯,那麼專注於他/她所說的話對我最大的利益。
應某人的要求,我將嘗試澄清我的答案。
假設我正在寫一篇有關黑洞。顯然,我想寫最好的論文,但我不是地球上最好的物理學家。地球上最好的物理學家可能對該主題的引用最多。對主題的引用次數最多是否意味著被高引用的個人在主題方面總是正確的?不。我必須意識到,如果我指的是那個人的作品。假設史蒂芬·霍金(Stephen Hawking)在黑洞周圍一直都是對的,甚至假設他大多數時候都對,這是一個巨大而危險的假設。