據(jù)中國科學院計算技術研究所1月19日消息,近日,網上出現(xiàn)質疑“木蘭”語言的信息。中科院計算技術研究所獲知這一情況后高度重視。經所科研道德委員會初步調查,“木蘭”語言系該所員工劉雷創(chuàng)辦的中科智芯公司研發(fā)的面向青少年編程教育的集成化產品,該產品的開發(fā)包中包含了Python開源編譯器,對外卻聲稱“完全自主”。該行為存在欺瞞與虛假陳述的科研不端問題。中科院計算技術研究所已對當事人劉雷做出停職檢查的決定,并就管理責任責令編譯實驗室負責人作深刻檢討。
中科院計算技術研究所表示,目前正抓緊對該問題開展進一步深入調查,將盡快公布處理結果,并以此為戒加強管理。我所對由此造成的不良影響深表歉意,衷心感謝并誠懇接受社會各界的監(jiān)督和批評。
自主開發(fā)編程語言被指Python套殼,中科院開發(fā)者道歉
中科院計算所團隊“完全自主設計、開發(fā)和實現(xiàn)”的“木蘭”編程語言是Python語言的套殼產品?針對近日這一網絡質疑,1月17日,項目負責人、中科院計算所編譯實驗室員工劉雷在科學網上發(fā)表回應稱,木蘭語言在8位單片機上的編譯器是本團隊開發(fā)的,在32位單片機上的編譯器是基于Python開源編譯器進行的二次開發(fā),但在接受采訪中將木蘭編程語言和編譯器夸大為完全自主開發(fā)。
劉雷關于“木蘭”編程語言的情況說明全文如下:
本人系中科院計算所編譯實驗室員工。基于我在編譯技術上的科研積累創(chuàng)辦了中科智芯(北京)科技有限公司,該公司圍繞青少年編程教育,設計開發(fā)編程語言、編譯器和集成開發(fā)環(huán)境等產品。
為了更好地在中小學中普及計算思維,本人帶領團隊開發(fā)了一種稱為“木蘭“的編程語言。它包含三個組成部分:一、在語言規(guī)范上借鑒了Lua語言的特性并進行了擴展,增加數(shù)據(jù)表達方法等新的特性;二、開發(fā)了支持少兒編程教育的可視化編程環(huán)境;三、針對8位AVR單片機,實現(xiàn)了相應的編譯器和運行時系統(tǒng),開發(fā)了能模擬多任務執(zhí)行的虛擬機。以上產品已經在數(shù)百所中小學中,開展了10萬人次的編程科普活動。
針對STM32單片機,我們是基于Python開源編譯器進行的二次開發(fā),也就是先將木蘭語言的源程序轉換為Python的中間表示(AST),再在Python虛擬機上運行。這就是在開發(fā)和運行環(huán)境中會包含Python系統(tǒng)的原因。
在1月15日接受媒體采訪時,本人在對木蘭編程語言的介紹中,犯了以下錯誤:
1。 木蘭編程語言主要是用于中小學教育,在介紹中將它擴大到智能物聯(lián)領域。
2。 木蘭語言在8位單片機上的編譯器是本團隊開發(fā)的,在32位單片機上的編譯器是基于Python開源編譯器進行的二次開發(fā),但在接受采訪中將木蘭編程語言和編譯器夸大為完全自主開發(fā)。
對于此次在網絡上造成的不良影響,本人鄭重道歉,對給中科院、中科院計算所帶來的不良后果表示誠摯的歉意。本人感謝大家的監(jiān)督與批評,并深刻反省,保證不再出現(xiàn)類似問題。
此前,據(jù)中國新聞網等多家媒體報道,中國科學院計算技術研究所(以下簡稱中科院計算所)1月15日正式對外發(fā)布該所計算機體系結構國家重點實驗室編譯技術團隊自主研發(fā)、面向新一代人工智能和物聯(lián)網應用的“木蘭”編程語言體系,并推出“木蘭”開源軟件包,供全球用戶免費下載獲取。
但隨后網絡上爭議四起,知乎網友@沉迷單車就指出,從網絡下載的“木蘭”語言編輯器程序圖標來看,與用著名編程語言Python生成的應用程序圖標完全一致。“都不換個圖標嗎?”他問道。
澎湃新聞記者并未在中科院計算所或計算機體系結構國家重點實驗室官方網站上找到“木蘭”的發(fā)布信息,亦無下載鏈接。
“木蘭”的下載渠道在一家名為“中科智芯”的公司網站上。據(jù)企業(yè)主頁介紹,中科智芯(北京)科技有限公司是中國科學院計算技術研究所孵化企業(yè),源中科院計算所計算機體系結構國家重點實驗室而成立。
“木蘭”編程語言是該公司的重點產品,企業(yè)介紹稱,“木蘭”是“專為人工智能教育而生的中國自主知識產權編程語言,由中科智芯自主研發(fā)。語言設計上屏蔽了其他任何一種針對成人設計的編程語言特性,如編程環(huán)境調試復雜等,讓學生在編程語言學習之初不為細節(jié)所牽絆,具有更易理解、易于學習、易于閱讀、易于維護等特性;且支持跨平臺,對Android、UNIX、Windows都可以很好的兼容。”
有計算機業(yè)內人士對澎湃新聞記者表示,從目前能掌握的情況來看,“木蘭”語言更像是Python語言的“套殼”產物。“這個軟件就是在Python語言外邊套了一層殼,還是比較簡單的那種,相當于一個接口,連圖標都沒有改。”
“木蘭”圖標
使用Python制作的文件圖標
“對這個exe文件進行反向編譯后可以發(fā)現(xiàn),整個結構就是Python環(huán)境,比如其中有一個‘lib2to3’文件夾,就是只有python才會有的,是轉換python2到python3的lib。”上述業(yè)內人士對記者表示。
“木蘭”反向編譯結果
不過,上述業(yè)內人士也對記者表示,“還是要看‘木蘭’的源代碼,才能確定這個語言到底有多少自主研發(fā)成分,以及多少是來自Python語言。現(xiàn)在從公司網頁上無法看到源代碼,也就是說還沒做到完全開源。”
據(jù)此前報道,劉雷介紹稱,“木蘭”是中科院計算所團隊完全自主設計、開發(fā)和實現(xiàn)的編程語言,與之配套的編譯器與集成開發(fā)工具也完全由團隊自主實現(xiàn),“是我們真正掌握核心技術的編程語言”。
其介紹稱,“木蘭”定位為下一代重要應用——物聯(lián)網應用開發(fā)語言,打造物聯(lián)網智能執(zhí)行平臺,其采用最新的編程語言設計理念和編譯技術,在考慮性能的設備處理層,它提供面向輕量級物聯(lián)網設備和領域特定專用加速器的編程特性;在應用層面,它提供面向通用計算設備的編程語言并支持多種領域的定制化元編程。
據(jù)了解,以“木蘭”為基礎延伸的自主研發(fā)編程軟件、人工智能教材、教學裝備現(xiàn)已投入中小學、幼兒園使用,截至目前,“木蘭”應用范圍已涵蓋中國18個省市共700所中小學。
工商信息顯示,中科智芯(北京)科技有限公司持股70%的大股東是中科編易(北京)科技有限公司,而后者的大股東正是劉雷。
中科院計算所計算機體系結構國家重點實驗室網站顯示,劉雷,博士,工程師一級,在編程語言和并行編譯技術方向上具有豐富的科研和工程經驗,先后承擔過國家863項目、核高基重大專項項目的子課題,所研發(fā)的技術成果達到世界先進水平,在多個頂尖的國際會議和權威期刊上都發(fā)表論文10余篇。其開發(fā)的自動并行化編譯器的加速效果要明顯好于世界上最好商用編譯器Intel編譯器。
Python在1991年由荷蘭人Guido van Rossum發(fā)明,是一種跨平臺的計算機程序設計語言,近幾年因機器學習熱而受到關注。
二維碼