1.AIRLOOK發(fā)布超算平臺(tái),用AI實(shí)現(xiàn)建模語(yǔ)義化和自動(dòng)修模
以“還原世界的樣子”為發(fā)展愿景,國(guó)內(nèi)空間高精度數(shù)據(jù)運(yùn)營(yíng)商AIRLOOK正式發(fā)布面向?qū)嵕叭S數(shù)據(jù)生產(chǎn)和云端數(shù)據(jù)服務(wù)的超算平臺(tái)DataMaker。在DataMaker平臺(tái)的產(chǎn)品體系中,目前已推出一款本地化的實(shí)景三維建模軟件Trimotion,供行業(yè)用戶免費(fèi)使用;其云端化版本也即將于今年年底上線。
ITrimotion的著眼點(diǎn)在于通過(guò)AI實(shí)現(xiàn)對(duì)實(shí)景三維建模數(shù)據(jù)的語(yǔ)義化處理,及智能化修模。Trimotion對(duì)實(shí)景三維建模的語(yǔ)義化處理,在于利用AI手段,訓(xùn)練軟件做到對(duì)各類建筑物、道路、車輛、植被、水體等諸多要素的準(zhǔn)確識(shí)別,并在生產(chǎn)實(shí)景三維建模數(shù)據(jù)的同時(shí),同步輸出空間地理要素的單體分割結(jié)果。
2.人工智能+數(shù)字標(biāo)牌改變零售產(chǎn)業(yè)的N種方式
隨著技術(shù)的逐漸成熟,AI技術(shù)也開(kāi)始向數(shù)字標(biāo)牌領(lǐng)域滲透,并悄然改變著零售業(yè)的運(yùn)作模式。杰和科技作為智能數(shù)字標(biāo)牌開(kāi)發(fā)的先行者和探索者總結(jié)了以下“人工智能+數(shù)字標(biāo)牌”改變零售產(chǎn)業(yè)的幾種方式:
數(shù)據(jù)收集、深度學(xué)習(xí)(deep learning)、強(qiáng)化體驗(yàn)、定制內(nèi)容、大數(shù)據(jù)分析。
3.微軟新開(kāi)發(fā)一種基于AI的文本轉(zhuǎn)語(yǔ)音技術(shù),越來(lái)越逼近人類音色
最近,微軟方面?zhèn)鞒鱿ⅲ麄兯坪踉谶@個(gè)技術(shù)領(lǐng)域取得了一些小小的突破。這次微軟做出的模型在實(shí)際運(yùn)用中可能進(jìn)一步簡(jiǎn)化了轉(zhuǎn)換過(guò)程,即使是普通人也能快速上手使用這項(xiàng)功能。這款A(yù)I轉(zhuǎn)換軟件是由中國(guó)研究人員開(kāi)發(fā)的,基于200個(gè)語(yǔ)音樣本,他們能夠創(chuàng)造出聽(tīng)起來(lái)更加真實(shí)的語(yǔ)音。
技術(shù)突破的關(guān)鍵因素是“Transformers”,這是一種深度神經(jīng)網(wǎng)絡(luò),旨在模仿我們大腦中的神經(jīng)元。通過(guò)使用轉(zhuǎn)換器,它可以幫助它更有效地處理信息。到目前為止,從結(jié)果來(lái)看,新模型在單詞可懂度方面的得分為99.84%,盡管有報(bào)道稱它聽(tīng)起來(lái)仍然有點(diǎn)機(jī)械。如果想親自體驗(yàn)一下你可以搜索GitHub上發(fā)布的樣本去試聽(tīng)。
4.未來(lái)十年AI將深刻影響教育 松鼠AI投一千萬(wàn)美元成立實(shí)驗(yàn)室
第三屆AIAED全球AI+智適應(yīng)峰會(huì)24日-25日在北京召開(kāi)。在此次峰會(huì)上,卡耐基梅隆大學(xué)與學(xué)教育松鼠AI聯(lián)合實(shí)驗(yàn)室正式簽約并啟動(dòng),松鼠AI將投入1000萬(wàn)美金,加速推動(dòng)AI教育發(fā)展。
Ken Koedinger教授表示,我們有共同的愿景,我們的研究方向可以給世界帶來(lái)非常大的改變,松鼠AI一直致力于智適應(yīng)在教育中的應(yīng)用,也支持長(zhǎng)期的科學(xué)發(fā)展,五年、七年,甚至更長(zhǎng)的時(shí)間,所以非常珍視這樣合作的機(jī)會(huì)。
5.搜狗AI進(jìn)化之路:從應(yīng)用為王,到顛覆式創(chuàng)新
搜狗“變聲”,顛覆性進(jìn)展,無(wú)論說(shuō)話者是誰(shuí),無(wú)論說(shuō)什么,不用考慮說(shuō)話人的特點(diǎn),最后能夠?qū)ⅰ叭我庹f(shuō)話人”音色實(shí)時(shí)高逼真度變換到“指定說(shuō)話人”音色,則是 Any to one.。該過(guò)程中,不光是輸入輸出兩端的映射關(guān)系變化,更是技術(shù)實(shí)現(xiàn)難度上指數(shù)級(jí)提升。
如何將“千人千聲”通過(guò)技術(shù)處理,變?yōu)橥环N指定聲音,同時(shí)還不丟失原說(shuō)話人的語(yǔ)言習(xí)慣?
離不開(kāi)展現(xiàn)真正技術(shù)的語(yǔ)音表征學(xué)習(xí)和遷移學(xué)習(xí)的突破,簡(jiǎn)要來(lái)說(shuō)三步:
首先,使用表征學(xué)習(xí)技術(shù)學(xué)習(xí)到源端說(shuō)話人語(yǔ)音的音色、內(nèi)容和韻律(講話節(jié)奏、情感語(yǔ)氣等信息)三大特征。
其次,將學(xué)習(xí)到的源端說(shuō)話人音色特征替換成目標(biāo)說(shuō)話人。
最后,基于新的語(yǔ)音變聲技術(shù),使用內(nèi)容(源端)、韻律(源端)、音色(目標(biāo)端)三類特征,合成最終生成變聲音頻。
這也是搜狗突破稱得上顛覆性的原因這是全球首次將如此難度的變聲能力落實(shí)到消費(fèi)級(jí)產(chǎn)品中。并且還不是自家用軟件專門定義打造的終端硬件,而是融會(huì)貫通到小小“搜狗輸入法”App中。通過(guò)App,無(wú)論安卓還是iOS,無(wú)論什么品牌、何種價(jià)位的手機(jī),都能實(shí)現(xiàn)“變聲”,實(shí)時(shí)遷移成“表情語(yǔ)音包”。未來(lái)應(yīng)用自然不止于此。
6.創(chuàng)新工場(chǎng)成立人工智能研究公司
5月23日,創(chuàng)新工場(chǎng)(北京)企業(yè)管理股份有限公司新增對(duì)外投資,成立創(chuàng)新工場(chǎng)(廣州)人工智能研究有限公司,注冊(cè)資本500萬(wàn)元人民幣,法定代表人為王詠剛,該公司由創(chuàng)新工場(chǎng)100%控股,經(jīng)營(yíng)范圍包括:計(jì)算機(jī)技術(shù)開(kāi)發(fā)、技術(shù)服務(wù);人工智能算法軟件的技術(shù)開(kāi)發(fā)與技術(shù)服務(wù)等。