0
本文作者: 周蕾 | 2022-10-28 17:57 |
外界提起即構(gòu)科技時,往往會打上“技術(shù)宅”“理工男”的標(biāo)簽。與即構(gòu)科技CEO林友堯交談時,你會很快意識到,這股“技術(shù)宅”的濃厚氣質(zhì)究竟從何而來。談起技術(shù),他如數(shù)家珍,項目的細(xì)節(jié)小到一處參數(shù),毫秒級的突破如何誕生,全都娓娓道來。
聯(lián)合創(chuàng)始人蔣寧波告訴我們,“yy(林友堯)是很愛學(xué)習(xí)的人,新事物、新技術(shù)他都要親自研究?!奔礃?gòu)早期對接了不少直播平臺類客戶,林友堯會親自去測試的直播間里轉(zhuǎn)一圈看看效果,有時還得給負(fù)責(zé)測試的同事刷兩個火箭,“不然有點不好意思”。
這種親力親為,在即構(gòu)科技成立的第七年,仍然在延續(xù)。不久前即構(gòu)科技推出了可實時捕捉面部表情的Avatar技術(shù),他迅速把微信狀態(tài)換成了Avatar技術(shù)給自己生成的虛擬形象。
談技術(shù)是如魚得水,但技術(shù)以外的世界,對于即構(gòu)這群“技術(shù)宅”來說,就算不上多舒適了。談起做To B業(yè)務(wù)的“痛苦”,林友堯笑稱,早年間對接客戶的時候,“恨不得自己寫算了”。
“坦白講,我也更愿意說我們只是寫代碼。其實就那么幾個接口,多看看文檔,多踹兩腳就能用起來了,但有時客戶就是會掉坑?!?/p>
做To B有千難萬險,數(shù)年前接受采訪時,林友堯?qū)⑦M入To B領(lǐng)域形容為“闖進原始森林”。但再難再險也總得拼力一試,他和團隊很早篤定了一個道理:如果只談技術(shù),恐怕很難長遠(yuǎn),想要在行業(yè)里長期立足,得是技術(shù)+服務(wù)。
從早期純程序員的班底,到成功孵化出服務(wù)團隊、理清服務(wù)團隊的組成,即構(gòu)科技花了三四年時間,林友堯也逐漸梳理出在To B這片叢林里的生存之路。
文章開頭所提到的Avatar技術(shù),是即構(gòu)科技新推出的“元宇宙智能互動引擎”中的新產(chǎn)品Metaworld的一項核心組件。
即構(gòu)與元宇宙的淵源,用林友堯的話來說是“不謀而合”,但元宇宙的興起,也正好成為了即構(gòu)的一場技術(shù)能力大考。
林友堯告訴我們,這款產(chǎn)品的雛形誕生于2019年,當(dāng)時被命名為“互動智能”——彼時,“元宇宙”的概念尚未像今天這樣盛行。
為什么會想到要做“互動智能”?這與即構(gòu)自身以及AI+音視頻技術(shù)的發(fā)展密不可分:即構(gòu)從2015年開始,借著連麥、直播、音視頻通話的能力,切入到實時互動賽道。到2019年之后,他們注意到人工智能技術(shù)工程化逐步成熟并在眾多場景中落地開花,語音視頻的前后處理算法和能力也得到了廣度與深度兼具的發(fā)展。
與此同時,數(shù)字人、虛擬客服這類內(nèi)容的呈現(xiàn),包括網(wǎng)友們熟知的二次元歌姬演唱會,多年來仍以離線生產(chǎn)的方式在行進,以實時互動方式實現(xiàn)的案例偏少。
能否給用戶帶來更多元化的內(nèi)容和玩法,增強線上的實時互動,多做一些可玩性更強的輸出?即構(gòu)開始投入大量資源和人力,專門研究AI、音效處理、視覺處理、大規(guī)模線上人機交互和數(shù)據(jù)同步等多種算法和技術(shù),尋求線上互動的能力突破。
2021年初,元宇宙概念興起,與林友堯的想法不謀而合。
“元宇宙概念的出圈本身也代表著各行業(yè)技術(shù)儲備到了一定規(guī)模,足夠支撐行業(yè)去想象未來的虛擬空間會如何呈現(xiàn)。電子游戲幾十年的發(fā)展摸清了3D空間打造、物理交互反饋以及如何帶給人更強的沉浸感。同時線上社交領(lǐng)域的RTC技術(shù)足夠支撐更加高質(zhì)量的音視頻傳輸、在實時的場景下去做到接近現(xiàn)實世界的視聽體驗效果?!绷钟褕蛟赯EGO元宇宙智能互動引擎發(fā)布會上說道。
盡管即構(gòu)科技已在音視頻領(lǐng)域深耕多年,但元宇宙的流行速度之快,仍然給他們帶來了不小的挑戰(zhàn)。
林友堯告訴雷峰網(wǎng),“原來可能元宇宙的建模生產(chǎn)周期,要長達(dá)1-2個季度,但現(xiàn)在客戶想要一兩個月,甚至一兩個星期就上線,這對我們這種平臺型的廠商,要求很高。”
細(xì)化到元宇宙產(chǎn)品中的各個技術(shù)難點,也反復(fù)考驗著即構(gòu)的技術(shù)積累。例如更低的時延,更高的并發(fā)能力,渲染效果要與實時互動給出的指令同步等;又例如AI識別真人虛擬人生成表情時,需要有近60種表情參數(shù)來驅(qū)動虛擬人臉上的每一塊肌肉,渲染難度倍增,又該如何在用戶的手機上復(fù)現(xiàn)……
簡單來說,元宇宙中的一花一草,一顰一笑,各方面的精巧程度都遠(yuǎn)勝從前,同時還要考慮到如此龐大復(fù)雜的內(nèi)容,能否在水平參差不齊的終端上順利運行,能否承載住超高流量的沖擊。
林友堯透露,早在做元宇宙之前,即構(gòu)已經(jīng)把云游戲的延遲降到了70毫秒,“這不是一個算法就能搞定,是我們在工程上一點點摳出來的?!?/p>
他直言,當(dāng)中做工程化的經(jīng)歷有過不少痛苦,但即構(gòu)的班底經(jīng)歷過QQ這種超大規(guī)模海量服務(wù)的錘煉,經(jīng)歷過千人網(wǎng)課、萬人語聊以及大量直播、游戲等場景的打磨,“在元宇宙里面,可以把我們的技術(shù)充分地展現(xiàn)出來?!?/p>
談起通過場景打磨技術(shù),林友堯娓娓道來:以萬人語聊場景為例,“這不是簡單地把所有的聲音接入進來,會嘈雜得沒法聽,手機流量會突然暴漲,硬件的性能有可能承受不了而發(fā)熱,要考慮發(fā)言的權(quán)重如何設(shè)置,服務(wù)線怎么擇路……這些都在我們的規(guī)劃路徑里面?!?/p>
和技術(shù)“死磕”固然重要,但對即構(gòu)而言,在To B世界,生產(chǎn)流程、資源調(diào)配上的問題,那些技術(shù)以外的沼澤地,才是真正的挑戰(zhàn)所在。
線上KTV實時合唱,是即構(gòu)做過的解決方案中,較受歡迎的一種。要知道兩個人面對面合唱都未必能合上拍子,更何況當(dāng)時線上的延遲超過100毫秒,人耳對于50毫秒以上的延遲就會有比較明顯的感知,線上合唱難度可想而知。而即構(gòu)將這一場景的延遲攻克到70毫秒左右,讓實時合唱的可操作性再上一層樓。
但即構(gòu)很快也發(fā)現(xiàn),實現(xiàn)這種毫秒級的攻克,其實沒有完全解決客戶的燃眉之急,線上KTV除了技術(shù)問題,原來還有版權(quán)問題。
林友堯向雷峰網(wǎng)(公眾號:雷峰網(wǎng))回憶,許多選擇這一解決方案的客戶都是創(chuàng)業(yè)公司,采購的歌曲數(shù)量不多,但是版權(quán)方動輒開出一年百萬的天價版權(quán)費,這對創(chuàng)業(yè)公司來說根本無法接受。最后即構(gòu)通過集采的方式,替創(chuàng)業(yè)者們與版權(quán)方協(xié)商歌曲版權(quán)的打包售賣,盡可能攤薄版權(quán)費用,線上KTV方案也才順利落地。
“這些事情,不是純閉關(guān)修煉幾個月,攻克一個算法或者工程、做出細(xì)節(jié)就行,是涉及到社會工程學(xué)、合作協(xié)同的方方面面。”
做To B的日子往往不會順風(fēng)順?biāo)?,總有意想不到的痛苦出現(xiàn)。這些痛苦有時來自于客戶內(nèi)部的意見不統(tǒng)一:“(客戶的)老板有想法,但驗收可能是他手下的團隊來做,最終再回到老板手里來買單?!?/p>
有時,這些痛苦來自于與客戶溝通的瑣碎小事:“客戶有時會嫌棄我們接口不好用,其實已經(jīng)做得明明白白了,多踹幾次,多看幾回,多讀幾遍文檔,也能用起來,可他們就是會掉坑?!?/p>
林友堯笑稱,“早期做一些很小的客戶時,對方連發(fā)布流程都不太清楚,你跟他講半天,有時候著急起來真是恨不得自己寫(代碼)算了?!?/p>
即構(gòu)早期班底還是以程序員為主,對于他們來說,和客戶打交道的日常,遠(yuǎn)沒有寫代碼來得自在。但林友堯很清楚,技術(shù)若不能在實際業(yè)務(wù)場景中充分發(fā)揮作用,在客戶手里產(chǎn)生價值,那么再強的黑科技也只是程序員的內(nèi)部狂歡,必須要以“技術(shù)+服務(wù)”在行業(yè)內(nèi)立足。
為此,即構(gòu)科技花了大概三四年時間,從最初的純程序員的角色構(gòu)成,慢慢形成了“5種角色服務(wù)1個客戶”,即架構(gòu)師、交付工程師、產(chǎn)品專家、線上技術(shù)支持和銷售代表等多種角色共同服務(wù)。
并且,即構(gòu)也會做大量的準(zhǔn)備工作,例如詳細(xì)的日志和診斷工具,共同分析梳理,避免客戶在版本發(fā)布后出現(xiàn)問題。
同時,即構(gòu)也慢慢摸索出了自己的客戶策略。對于做大客戶還是做中小客戶,林友堯認(rèn)為,沒有一個確定的答案,即構(gòu)更愿意走一種平臺化的路線,對客戶來者不拒。
在面對大客戶時,即構(gòu)會考慮滿足他們的訴求,但絕不是為客戶單獨定制解決方案,而是將客戶需求主動抽象提煉出來,沉淀到產(chǎn)品主體,產(chǎn)品始終只有一個主版本在進行迭代。
而從行業(yè)角度來看,眼前的音視頻領(lǐng)域,不僅有即構(gòu)這樣的玩家,也有大廠試圖將自身的音視頻業(yè)務(wù)經(jīng)驗,沉淀為解決方案對外輸出——這種想做“降維打擊”的大廠,會讓創(chuàng)業(yè)公司們無路可走嗎?
但在林友堯眼中,部分大廠輸出自研音視頻技術(shù),最適合采購這類技術(shù)方案的企業(yè),極有可能原本就是大廠在音視頻領(lǐng)域的競爭對手,在既定的競合關(guān)系之下,這批企業(yè)未必愿意買大廠的賬。
另一方面,即構(gòu)這類初創(chuàng)公司將To B業(yè)務(wù)視為生命線,愿意全身心投入,但大廠本就要抽調(diào)大量精力來保障內(nèi)部業(yè)務(wù)的正常運行,這時還能投入多少人力物力服務(wù)外部客戶、開拓新受眾?大廠自然可以調(diào)動大量資源和團隊來攻打一個垂直賽道,但為了一條并不開闊的賽道,值得嗎?
“這一點,大廠也會有考量,有考量我們就有生存的機會。從創(chuàng)業(yè)的角度看,無非是夾縫中求生存,困境中求發(fā)展。”
離開騰訊、創(chuàng)辦即構(gòu),走上To B,這個過程曾經(jīng)被林友堯形容為:從一棵什么都有的大樹,來到一片原始森林。
某種程度上來說,To B世界確實也如熱帶雨林一般,有著極為復(fù)雜的生態(tài)系統(tǒng),危險遍布卻又生機無限。陽光和雨水的差異讓雨林天然生成了龐大的層狀結(jié)構(gòu),不同種類的植物都能在其中覓得自己的容身之所。即構(gòu)也逐漸在To B這片叢林中,找到了自己的定位、方向與生存之道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。