李教授的學生叫李燃——最初聽名字的時候,老趙心裡還猜想過,會不會是李教授的私生子,他才幫著學生出頭來找自己。
聽名字就很像,李明然,李燃。
不過見到真人之後,老趙可以確定不是。
李明然文質彬彬的斯斯文文,李燃乍一看和什麼博士碩士根本不沾邊,壓根就是一黑胖子,長相很兇惡,走在大街上跟黑豬成精沒啥兩樣,擱在古代,直接抓官府說他是山賊都有人信。
都說相由心生,老趙也搞不懂,他一個博士,在大學校園裡薰陶了快十年,怎麼長成這樣。
也難怪他找不到投資人,馬芸只是長得怪,並不惡,可這位李燃同學,任憑誰看到,第一印象都不會好。
趙澤君儘量讓自己拋開對醜人的刻版印象,去聽對方說話。
「趙總,我的研究成果主要是人工智慧語音……」能看得出來,面對面和趙澤君直接交流,李燃多少有點緊張,打開筆記本的時候差點把桌上的水杯給碰翻了。
趙澤君不動聲色的把對方的水杯稍稍朝一邊挪了點,點點頭,繼續聽他說。
「人工智慧,顧名思義,電腦可以像人一樣『說話』。我們平時從電腦里聽到的『說話聲音』,一般是事先錄製好的,比如說播放音樂,聽起來是電腦在說話,本質上是計算機播放了一段事先錄製的音頻,並不是計算機本身在唱歌。而人工智慧語音,就是讓電腦去識別文字,然後發出類似人的聲音……」
說著,他隨意輸入了一段文字,應該是徐志摩的詩,在軟體里點了幾下按鈕,電腦果然發出了很接近人類的聲音,朗讀這首詩。
但是電腦的聲音沒有感情,平淡無起伏,讀起來也斷斷續續的。
和後世的導航聲音原理差不多。
計算機是個很笨的東西,它的強項在於重複運算,而人類能做到的很簡單的事,對於計算機做來說就很困難,需要成千上萬的指令,甚至大部分是不可實現的。
比如感情、判斷,直覺等等。
一個成年人,『斷句』是非常簡單的事,根本不用過腦子,計算機卻得經過n道運算,無比廢力。
所以也有人說,人類本身,就是上帝創造的一種最神秘也最偉大的『生物機器』。
「我打斷一下。」趙澤君抬頭看了眼時間,然後說:「據我所知,科大騰飛也在做人工智慧語音這一塊,而且做得比你要好。我聽過,更加流暢,而且已經可以達到用中、英兩種語音。你的產品,優勢在哪裡呢?」
「趙總,這就是我接下來要說的。」李燃咽了口口水。
「別緊張,時間還很多。」老趙揮手笑笑。
「嗯。」李燃說:「是這樣的,騰飛的識別和朗讀,起步早,投入大,比我的研究要領先。但是在人聲音的模擬上,我可能要超過他們。」
「騰飛也有人聲模擬吧。比如,模仿某個明星的聲音。」趙澤君很清楚的記得後世的導航里,應用的就是模擬技術,可以選擇郭德綱的聲音,林志林的聲音,聽起來還都挺像那麼回事。
「但是您不覺得,騰飛模擬的聲音,這是形似,而不是神似嘛?」說起專業擅長,李燃好像變了一個人,目光炯炯有神地反問,「是能模擬出明星的聲音,可並沒有神韻,一聽就是機器聲。」
「這倒是。沒有感情起伏和頓挫。」趙澤君點點頭。
「用專業術語說,聲音三個主要特徵,是音調、響度和音色,響度是聲音波形的振動幅度,音調的頻率,也即是經常說的男高音、女中音之類,音色是聲音波的波形,決定了聲音的品質。」
李燃開始侃侃而談:「模擬一個人的聲音,第一步是這三個特徵和本人的特徵極為接近,這一點上,騰飛做得比我要好,但並非不能趕超的。像跑步,他們跑得快些,先跑了半分鐘,我雖然落後,但只要一直跑,也能達到他們的水平……」
老趙點點頭,示意他繼續。
「第一步,三種特徵實現形似,第二步,想要實現神似,就必須捕捉一個人聲音這三者的配合方式,通過計算機表現出來,並且要存儲一個人大量的說話習慣,才能模擬對方真實的說話聲音。」
「你能演示一下嗎?」趙澤君問。
「可以。就用我自己舉例子吧,我在資料庫里存儲了我個人大概十個小時的講話,講話內容都很隨意,如果不用這個資料庫,電腦模仿我的聲音,大概是這樣的……」
他點開了程序,電腦的讀了一段話,乍一聽和李燃的聲音很接近,但稍稍留心下,就會判斷出這不是李燃。
有形無神,像是李燃很機械的在說話。
「那麼如果用我的聲音資料庫,進行分析後,就是這樣的……」李燃低著頭一邊操作電腦,一邊說。
可說完之後,電腦沒有發出任何聲音。
「怎麼了?」趙澤君一愣,問。
只見李燃抬起頭來,笑呵呵的看著老趙,嘴唇緊閉。
但是他的聲音又一次在房間裡響起:「那麼如果用我的聲音資料庫,進行分析後,就是這樣的……」
「哦!」老趙恍然大悟,剛才李燃低頭時候根本沒說話,他聽到的,只是電腦里的人工智慧聲音。
「有點意思,你再放一遍,我仔細聽聽。」趙澤君說。
「我放點別的吧,讓它讀一段文章。」李燃這次是自己說的,然後導入了一段常用的聊天話語,重新啟動了程序。
「阿姨你好,我是李燃,請問李教授在家嗎,是這樣的,我有一個項目……」
趙澤君仔細的聽著,微微點頭。
這次先入為主,知道這是機器聲音,然後專門留心去判別,還是能發覺和李燃本人是有一定差別的。
但如果不留意,或者和李燃不是很熟悉的話,乍一聽,說話的這個人就是李燃。
「如果換成模擬別人呢?」趙澤君問。
「資料庫越龐大詳細,模擬的越是準確。」李燃說:「我試驗過,一般能有對方四五個小時的講話作為數據,差不多就能大致掌握對方的說話習慣,數據越多越詳細,模擬得越逼真。像剛才那段,有我十個小時的講話時間。但是理論上來說,不可能百分之百以假亂真。」
「嗯。」老趙又一次看了看時間,已經過去了35分鐘,「你這個技術的確有意思,但未來怎麼進行商業應用?」
「趙總,我暫時並不準備進行商業化。這項技術尚不成熟,第一步模擬聲音三特徵距離騰飛還有段路要走;第二步,收集資料庫暫時也沒有任何規律可言,只能通過大量的講話,我想把這兩個問題都解決了,技術進一步成熟之後,再商業化應用。」
李燃咧嘴一笑:「不過科研都需要錢,我自己生活
第二百二十八章夢蝶