我應該分享我的可怕軟件嗎？

qsp

2015-01-23 03:21:48 UTC

view on stackexchange narkive permalink

發表論文後，有人要求我分享我開發的軟件。起初，我很高興自己的論文引起了人們的關注，並且不僅分享了二進製文件，而且還分享了源代碼，案例研究等。但是看著我的軟件，我感到很尷尬。

我的軟件簡直太恐怖了：源代碼簡直一團糟，其中包含我幾次失敗的嘗試。我從未使用過設計模式，因此到處都有重複的代碼。為了簡化和快速實現，我經常更喜歡遞歸而不是循環等。

我總是承受產生新結果的壓力，清理這些代碼將花費我大量的精力。

我的問題是，共享這個可怕的軟件是否會給人們帶來對我的負面印象？如果我共享的人是在同一領域工作的潛在合作者，雇主，這會對我的職業造成傷害。

聽起來像學術軟件。

相關：[如何共享計算機代碼]（http://academia.stackexchange.com/questions/16785/how-to-share-computer-code?lq=1）和[“研究”代碼的最佳實踐模型？ ]（http://academia.stackexchange.com/q/21276/10643）和經典著作：[為什麼許多才華橫溢的科學家編寫可怕的軟件？]（http://academia.stackexchange.com/q/17781/10643）

我不確定我能為您提供多少幫助，但是我看過這個視頻，根據您的問題，這可能會給您帶來一些鼓勵。 https://www.google.co.uk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&uact=8&ved=0CCsQtwIwAg&url=http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv% 3D0SARbwvhupQ＆ei = k2rBVKP8J8P1OPbMgagL＆usg = AFQjCNEIXszWW5AeYeh5TglmX2_yHFD7WA＆bvm = bv.83829542，d.ZWU對不起，我想幫您更多，我只想向您展示此視頻。

骯髒的秘密：*大多數*學術軟件是可怕的。甚至從計算機科學係出來的東西。

您可以根據CRAP許可發布它：http://matt.might.net/articles/crapl/

研究通常涉及嘗試一千種不起作用的事情。如果您設法編寫在前幾次嘗試中都能起作用的代碼，則您可能不是在做研究，而只是在執行。

[這篇論文]（http://www.siam.org/news/news.php?id=2064）在SIAM期刊上引人入勝，引人注目。

需要考慮的另一點：如果您的某些結論是基於軟件錯誤引起的虛假數據怎麼辦？讀者應該能夠檢查一下。

將代碼發佈到諸如GitHub之類的公共場所使您有機會展示如何逐步改進軟件。在不更改軟件生成結果的情況下顯著改進軟件並非易事，因此是一項備受重視的技能。您可能會發現將一些代碼發佈到代碼查看站點https://codereview.stackexchange.com/可以在此處獲得幫助。

@qsphan出於好奇，您的論文是關於什麼的？

要添加到對話中：http://www.phdcomics.com/comics/archive.php?comicid=1692

@mankoff:請不要。該許可證是“糟糕的”。在3句BSD下發布它，並貼上一個大大的標籤，警告它質量是一個更好的選擇。

許多非學術軟件也很混亂。最近的bash錯誤...

Blah，作為一名程序員：“我一直承受著產生新結果的壓力，而清理這些代碼將使我付出巨大的努力。”您是否意識到承受如此巨大壓力的原因是因為您花費大量時間對代碼進行調試以至於您從未費心編寫或維護正確的代碼？

即使代碼確實很糟糕（我對此表示懷疑），它仍然經過了艱苦的測試和調試，比使用最新的設計模式等還有價值得多。請確保在基礎平台上添加詳細說明（Ubuntu 12.04，OS X如果使用XCode 10.7和libX版本Y等），可能會產生細微的差異，從而產生問題，以及有關如何編譯和鏈接程序的完整說明。您在編寫它時可能已經實現了某種程度的自動化-只需記下它，以便其他人可以看到。

除非編程語言不支持優化遞歸，否則遞歸沒什麼問題

@Philipp:更讓我擔心的是這種情況是正確的，但是代碼中有一個討厭的錯誤。在那種情況下，修復錯誤將改變答案的正確性，但不會（說出）其性能特徵...因此，如果發布代碼，那麼即使結果可能不會失效，也有使自己尷尬的風險。（我之前在自己的代碼中發現了這類錯誤。）

是否學術都沒關係。 http://blog.codinghorror.com/version-1-sucks-but-ship-it-anyway/

@Mark:大多數軟件都是可怕的，句號。不僅僅限於學術，也不是真正的秘密。 ;-)

除此之外，即使每天在主要應用程序中使用的科學軟件也變得混亂和可怕-Met Office使用的代碼仍在Fortran中，並且幾十年前遍布各地...

@djechlin儘管偶爾會如此，但“壓力的根源是您的不良編碼”並不總是可以推廣。除非我的Python技能引起了最新的埃博拉疫情？

@Fomite關於您的Python技能的一些原因，就是為什麼您還沒有完成埃博拉病毒的研究，如果您想這樣說：P

@djechlin不，我認為這可能與仍然垂死的人們有關...

@Fomite如果有人死了，為什麼還要花那麼多時間寫代碼呢？

@Fomite我的意思是，如果要“做”它，那麼它應該“做得好”，而“快速”做，如果這是您工作中的“主要”瓶頸。我想您可以說工作中的主要瓶頸是ebola的普及率，但是在那之後，這真是一個極好的機會，這可能是您的代碼工作得很好的方式。但是，如果您要堅持埃博拉病毒的存在是問題所在，那麼您將擁有更大的權力。

@djechlin我只是在指出，對學者施加壓力的根源歸結為不良編碼，這一觀點既極度自以為是，而且絕對不能推廣。

是否可以與本科生或研究生CS學生合作，並讓他們“清理”一些代碼？

程序員的建議：不要將失敗的嘗試作為註釋掉的代碼或未使用的類。而是經常將（半）工作版本提交到源代碼管理（GIT）。__總是__刪除不再需要的無效代碼！如果必須返回到較早的版本，請從源代碼管理中還原它。這樣一來，您可以更輕鬆地掌握代碼，因為要讀取的代碼要少得多。關於您的代碼未使用精美的設計模式等方面，這可能是一件好事，請使其盡可能簡單，僅在絕對需要的地方增加複雜性。

def main（）：get_foobar（x，y）def get_foobar（）：返回x ** ydef get_foobar_legacy_1（）：“”“此嘗試不適用於值> 100”“” return x + ydef get_foobar_legacy_2（）：“”“此嘗試在9月的星期三不起作用”“” return x-y