前 YY CTO 的隐形公司:6 亿分钟日服务,30 亿终端覆盖,你我皆用户
成为行业头号玩家之后,声网从云服务商向云生态发起者进阶。
一直以来,2B 型企业重技术,却在品牌认知层面与 C 端疏离。前者是竞争优势,后者是先天不足。成立六年的声网亦是如此,即便已是 RTC(Real-Time Communication)领域的头号玩家,「每每被人提及,知名度却还是局限于业内,」声网创始人、CEO 赵斌如是说。
赵斌对此不以为意,他希望声网「隐秘而伟大」。事实上,无论是抖音、陌陌、B 站和斗鱼,还是全民枪战、三国杀,抑或是 VIPKID、学而思等,甚至是在线理赔、智能音箱和儿童手表,都是由声网来提供音视频服务。本质上,任何的 B2B,最终都将汇入 2C。这些产品和应用的用户,皆是声网的用户。
声网的实时消息 SDK 的四大应用场景 | 声网
新战场开辟
赵斌在网络实时通讯领域从业 20 多年。 2014 年,他卸任 YY CTO,二次创业,创立实时音视频服务企业声网。声网成立时,国内没有任何一家专门做移动端音视频实时传输的云服务解决方案的公司。虽然国外也有不少公司,以打包的方式向企业客户出售语音通话服务,但并不是以云服务的方式向客户提供,在费用和体验上没有做到极致。于是,赵斌发掘并切入进这片蓝海市场。
简单来说,声网做的事情,就是让用户在使用互联网的过程中,享受逼近真实生活的视听体验,即为各类产品和应用提供不卡、不糊、不延时的音视频传输服务。
以 2015 年以软件定义实时网 SD-RTN™服务为起始,声网正式对外提供实时音视频服务,当时的单日服务分钟数达到百万级。包括纪源资本、晨兴、SIG、顺为以及 IDG 在内的头部资本,为声网提供了 2000 万美元的 B 轮融资。次年,声网推出了全球首个基于用户数据报协议(UDP,User Datagram Protocol,)的连麦互动直播 SDK,单日服务分钟数增长 6 倍。
里程碑式的突破发生于 2017 年,声网推出了 Unity 和 Cocos 的实时游戏音视频 SDK。归功于游戏狼人杀的一度风靡,直接令声网的单日服务分钟数飙升至 1 亿。2018 年,声网又抓住直播和在线教育的风口,单日服务分钟数翻了 3 倍。同年,声网分别在 6 月和 11 月收获了 B+ 轮和 C 轮融资,总计 1 亿美元。
声网创始人兼 CEO 赵斌 | 声网
用时六年,声网把 RTC 产业从无做到有。2019 年,声网单日服务分钟数达到 6 亿分钟。这 6 亿分钟,相当于微信语音日通话分钟数的四分之一。数字的背后,「既是客户对产品质量肯定的结果,也是用户对声网提供服务满意的结果」,赵斌向极客公园(id:geekpark)表示。
然而,这 6 亿的数值是否是 RTC 行业里面的天花板或曲线末端呢?声网的答案是「No」。赵斌认为,RTC 行业仍处于互联网音视频服务的早期。随着 5G 逐步走向普及,基础设施的进步,用户会在越来越多的场景和行业使用音视频服务。声网的终极目标,就像马云的说法,要让天下没有难做的音视频服务的生意。
声网为泛娱乐社交客户提供多场景的整体解决方案 | 声网
迄今为止,声网的行业客户来自教育、娱乐、社交、游戏、在线金融、在线保险、IOT、企业、传统教育等多个领域,覆盖的场景过百。SDK 支持 PC,安卓、IOS 在内的 18 种平台和架构,全球有超过 15 万家企业注册了声网的服务,有 30 亿终端在间接使用声网提供的服务。
在电信行业,服务可用时间是非常重要的指标。声网全年不可用服务时间不超过全年时间的万分之一。频道能力方面,声网支持一万人的群组通话,和十万人的大频道以及上千万的并发能力。
声网号称是世界首家把实时音视频能力,以 API 的形式开放给开发者和合作伙伴的公司,把实时音视频能力集成到产品和应用中。赵斌坦言:「公司成长的过程很大程度上依赖于产品的演变和迭代。」
2018 年赵斌和团队觉察到,音视频服务要改变基于网络模式的服务方式。「只有保证质量,才能做商业化运营。」赵斌强调,声网不是即时传输的公司,在实时传输的网络保障方面解决了很多技术挑战。
例如在漏网的情况下,声网在网络对抗方面,实现了在 60% 丢包的情况下保证音视频流畅,70% 的丢包环境下保证音频流畅。而声网下一代 SDK 的表现,将实现在 80% 丢包率的情况下,视频流畅度和清晰度更优,降低延时和卡顿。在音频方面,通过丢包隐藏技术,可在 25% 的丢包率情况下,在听感上保证音频的连续性。
实时服务的挑战
从总结和回顾的视角,赵斌认为在最近一两年里面,「实时互联网 + 业务」领域已经出现了全面升级的特征。这种全面升级在声网看来有以下五点:
第一是延时。客户希望互动直播可以更加实时,至少为用户提供超低延时直播的体验,才能进一步加强用户的参与感和黏性。
第二是兼容。无论是设备还是网络的接入,只有覆盖得更全面、更完整,才能保证用户的使用体验和接入能力没有空白。
第三是规模。譬如在企业和客户请 Ladygaga 表演,会有几百万的人鱼贯而入,那系统如何做好打入大体量的承接。除了单一的规模,整体的能力和体量,以及效率和高清都是考量因素。
第四是效率。Low-code(构建自定义代码开发)甚至 No-code(零代码 - 拖放式编辑)快速开发应用,正在成为新的趋势。声网将实时音视频和合作伙伴的业务能力结合,无论单一接口的功能还是场景解决方案,都可以根据实际需求,通过低代码模块组建的方式自由组合,帮助开发者少写甚至不写代码快速开发应用,提升效率。
第五是高清。声网的视频通话 SDK 最高可支持 1080P 动态分辨率和超分算法,可以满足不同终端对视频清晰度的高品质显示需求。
在教培领域,声网针对不同细分场景提供的多种能力保障 | 声网
赵斌指出,所谓互动分为强与弱,如果在面对面交流的过程中,技术无法解决感知上的延迟,会直接导致参与互动的双方在解读不正确。在实时互动必须在 400 毫秒以内,才能保证体验的前提下。声网以 76 毫秒为全网延迟中位数,超过 50% 的通讯时间都在这一通信环境下。
而最近发布的云游戏服务,要求实时性控制 20 毫秒内,甚至有些游戏玩家的控制动作和动作产生的效应延迟不到 10 毫秒。赵斌说,这背后需要团队死磕细节指标,「只有做到超越人能感知的边界,才能让用户在无论生活还是工作的条件下享受完美的体验。」
声网面临的挑战和困难不止于此。随着视频业务的增长,越来越多的用户在享用高清、4K 的内容和服务时,对网络带宽造成不小的压力。解决信息高速公路拥堵的问题,势必要对视频进一步做好压缩。
据了解,声网利用人工智能、深度学习的算法研发出了基于感知编码的技术,在保持主观质量不变的情况下,实现了全部场景 23% 的压缩率,会议和直播场景能节省 30% 的码率。
此外,如何使深度学习模型实时地运行在移动设备上、并有效地控制设备的功耗和发热,声网研发团队做了大量的开创性工作,最终使得自研的深度学习模型大小得以大幅缩小,仅以不到谷歌 MobileNet V2 模型百分之一的大小有效地实现了视频感知编码压缩和超分变率增强的效果。「只有做到几乎穷尽所有可能,才能设计出优秀的算法,达成上述目标,做到业界领先」,他表示。
云服务转向云生态
眼下,声网不光是为客户提供服务,很多客户也成为了声网的合作伙伴。赵斌透露,在社交和在线教育领域,70% 到 80% 的公司都在使用声网的服务。在和客户对接和提供服务的过程中,声网又再创了一些新的价值和应用模型。
随着语音视频行业的监管越来越规范,不止一个开发者希望声网做语聊房业务的时候,把鉴黄的模块加入到 SDK 中。赵斌觉得,这是很好的需求,但集成能力有限。行业的完整生态,需要借助合作伙伴的力量一同构建。因此,声网希望通过招募全球合作伙伴的方式,在基础能力之上,为客户的个性化需求集成到产品中。
Agora 云市场计划发布之后,行业客户也将成为声网的合作伙伴 | 声网
这项全球合作计划被称之「Agora 云市场」(AgoraPartner Gallery)。据了解,首批入驻的有 34 家企业,既有 Unity 这样的游戏基础引擎商,也有阿里云、金山云等平台,还有在互动白板、语音鉴黄有技术积累的创业公司。
声网的云生态,首先是在实时互动场景下应运而生。其更聚焦如何把场景完整化,并为开发者赋能。
其次,声网作为一家 API(Application Programming Interface,应用程序接口)企业,未来要把所有的功能模块、解决方案,通过最简化的代码集成方式,降低开发者的负担,从而帮助他们快速实现上线,实现业务增长。
再有,除了技术优势外,声网作为全球化企业,本土化运营能力保证了云市场和云生态,是一个聚集全球能力和伙伴的集合体。首批聚集的 34 家合作伙伴,其中不乏来自海外的开发力量。
而最重要的一点,就是要帮助合作伙伴快速地变现。在这方面,声网一方面通过云市场、线上分发、销售流量触达所有的开发者。另一方面,依靠整合和优化销售能力,打开大企业客户的渠道,增加合作伙伴的收益能力。当生态与销售这两个渠道打通之后,不仅可以获得开发者的认可,同时也提高了开发者的收益水平。
赵斌吐露,从成立声网的第一天起,他的目标不只是打造一家专业的音视频互动服务商,而是在行业内,让声网被贴上基础能力和服务最极致的标签。
CTO 转型 CEO 之后,管理者始终绕不开人和效率的问题。接近 400 人的人员配置,盘活一个组织,正确的方法最为重要。他倡导「专业驱动行业进化」,每个岗位的同事都要学会独立思考,什么是更专业的做法,或者更正确的做法,然后一切以此为参照,进行认知升级和自我调整。
对于 2B 企业的创始人而言,最难以分辨的就是「帮助开发者和用户价值最大化」的边界线。所有人都知道要把资源投到需求特别旺盛、特别集中的领域,才会产生价值。但难的是,对于细微的场景的判断,会不会迎来爆发,值不值得会投入资源和人力。用前瞻性思维抓住了这个变量,会迎来指数级增长,如果押错了注,投入产出不成正比。效率把握失衡,创业公司一定概率下,面对的就是生死存亡。
本文作者:包校千
责任编辑:卧虫
图片来源:声网