欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RTC 場景下的屏幕共享優(yōu)化實踐1

jf_78858299 ? 來源:字節(jié)跳動技術團隊 ? 作者:張耿祥 ? 2023-05-26 17:01 ? 次閱讀

背景介紹

需求背景

屏幕共享是視頻會議場景使用最廣泛的功能之一,在共享一個 PPT 或者文檔的情況下,人們對畫面清晰度有著極高的要求,“看不清” 是最容易被用戶吐槽的事情;而在共享一個視頻素材的情況下,大家又對流暢度有著極高的要求,“卡頓” 也是最容易被用戶吐槽的點。

為了更好地同時滿足用戶對清晰度和流暢度的要求,視頻會議軟件通常會設計兩種模式:

  1. 清晰模式:主打清晰度,盡量保持高分辨率(如:最高 4K 原畫質),帶寬或性能不足的時候,只降低幀率(如:從 30fps -> 5fps),不降低分辨率。
  2. 流暢模式:主打流暢度,盡量提升幀率(如:最高 30fps),帶寬或性能不足的時候,優(yōu)先降低分辨率(如:從 4K -> 720p),最后才考慮降幀率。通常情況下,默認選擇“清晰模式”,當用戶要共享視頻的時候,需要自己 “手動” 點擊勾選上 “流暢度優(yōu)先”按鈕。

一般的做法是,讓用戶在共享屏幕時手動來勾選“清晰模式”還是“流暢模式”。但在實際的產(chǎn)品場景中,用戶對這兩種模式的感知并不是很強烈,不太可能要求用戶在共享屏幕的過程中手動來回切換當前的共享模式,對用戶體驗影響比較大。

一種簡單的方案是根據(jù)用戶共享內容的文件后綴名來決定是“清晰度優(yōu)先”還是“流暢度優(yōu)先”,比如共享 PPT 時自動切換為“清晰模式”,共享視頻時自動切換為“流暢模式”,但是這樣設計會遇到一些問題:比如用戶的 PPT 里嵌入了一段視頻,在播放這段視頻時理應追求“流暢度優(yōu)先”;而如果用戶視頻其實是一段 PPT 的教學錄屏,里面有大量的時間在播放靜止的文字和畫面,這時候“流暢模式”則會導致這些關鍵內容顯得模糊。

RTC 要如何幫助用戶及時調整最佳的共享模式呢?

需求分析

需求功能分析

痛點:

用戶分享視頻內容需要高幀率,而文字/ppt 需要高清晰度,這兩種場景的需求是互相矛盾的,如果需要用戶手動勾選相應的共享模式,不僅操作繁瑣,也容易漏選、錯選。

如何解決:

需要研發(fā)一個算法自動識別共享內容,進而確定當前是需要高幀率還是需要高清晰度。這樣,在用戶想要清晰畫面的時候,產(chǎn)品就提供清晰的畫面,用戶想要流暢的視頻體驗時,產(chǎn)品就盡可能地保障屏幕畫面的流暢性,用戶在無感知的情況下就能獲得當前場景的最佳體驗。

屏幕共享場景定義

清晰度優(yōu)先的場景

以文字為主,用戶更需要看清楚畫面的邊緣特征,而較少關注其運動特征。

流暢度優(yōu)先的場景

以視頻內容為主,用戶更需要流暢連貫的動態(tài)畫面,而較少關注于單幀的清晰度。

技術實現(xiàn)

算法原理

學界相關成果概述

目前我們參考了以下兩篇參考文獻。第一篇是 Jing, Wang & Xuetao, Guan & Yang, Zhang. (2013). An Adaptive Encoding Application Sharing System Based on Remote Display. 266-269. 10.1109/ISDEA.2012.66.

該論文主要假定視頻區(qū)域的均會以 24-30FPS 的頻率發(fā)生變化,用 N*N 的 patch 的形式進行檢測,從而發(fā)現(xiàn)視頻區(qū)域。

第二篇參考文獻是,侯文慧, 王俊峰. 面向云桌面協(xié)議的視頻區(qū)域偵測算法[J]. 計算機應用, 2018, 038(005):1463-1469,1487.

這篇論文主要通過高變化區(qū)域偵測,并利用傳統(tǒng) sobel 算子+膨脹算法的邊緣檢測發(fā)現(xiàn)可能的矩形區(qū)域,通過顏色直方圖的顏色數(shù)量判定文本區(qū)域從而確定視頻內容區(qū)域。

相關算法的介紹

  1. 光流

光流(Optical flow or optic flow)是空間運動物體在成像平面上的像素運動的瞬時速度,是分析像素運動的一種方法。光流法在模式識別、計算機視覺以及其他圖像處理領域中用處廣泛,可用于運動檢測、圖像分割、運動補償編碼和立體視差測量等領域。

光流法實際是通過檢測圖像像素點隨時間的變化進而推斷出物體移動速度及方向的方法。假設該移動很小,那么可以根據(jù)泰勒級數(shù)得出:

圖片

因此可以推出

圖片

最終可得出光流方程:

圖片

圖片

這個方程有兩個未知數(shù),不能直接進行求解,這被稱為光流算法的孔徑問題。為了求解光流方程,還需要另一組方程,這個方程由附加的約束給出。(以上內容引用自 wikipedia)

圖片

孔徑問題

(孔徑問題示意,引用自:https://zhuanlan.zhihu.com/p/74460341)

假設:

  • 相鄰幀之間的亮度恒定;
  • 相鄰視頻幀的取幀時間連續(xù),或者,相鄰幀之間物體的運動比較“微小”;
  1. 決策樹

決策樹是一種邏輯簡單的機器學習算法,它是一種樹形結構,所以叫決策樹。這是一種基于 if-then-else 規(guī)則的有監(jiān)督學習算法,決策樹的這些規(guī)則通過訓練得到,而不是人工制定的。

圖片

  • 決策樹易于理解和解釋,可以可視化分析,容易提取出規(guī)則;
  • 可以同時處理標稱型和數(shù)值型數(shù)據(jù);
  • 比較適合處理有缺失屬性的樣本;
  • 能夠處理不相關的特征;
  • 測試數(shù)據(jù)集時,運行速度比較快;
  • 在相對短的時間內能夠對大型數(shù)據(jù)源做出可行且效果良好的結果。(引用自 wikipedia)
  1. 顏色直方圖

顏色直方圖是許多圖像檢索系統(tǒng)中被廣泛采用的顏色特征。它所描述的是不同色彩在整幅圖像中所占的比例,而并不關心每種色彩所處的空間位置,即無法描述圖像中的對象或物體。(引用自 wikipedia)

圖片

  1. 方向統(tǒng)計(Directional Statistics)

Directional statistics (also circular statistics or spherical statistics) is the subdiscipline of statistics that deals with directions (unit vectors in R(n)), axes (lines through the origin in R(n)) or rotations in R(n). More generally, directional statistics deals with observations on compact Riemannian manifolds including the Stiefel manifold. The fact that 0 degrees and 360 degrees are identical angles, so that for example 180 degrees is not a sensible mean of 2 degrees and 358 degrees, provides one illustration that special statistical methods are required for the analysis of some types of data (in this case, angular data). Other examples of data that may be regarded as directional include statistics involving temporal periods (e.g. time of day, week, month, year, etc.), compass directions, dihedral angles in molecules, orientations, rotations and so on. (引用自 wikipedia)

利用方向統(tǒng)計方法,能夠準確地統(tǒng)計出向量樣本的方向均值,以及方向的離散程度,也避免了傳統(tǒng)統(tǒng)計方法在角度值統(tǒng)計計算上的誤差。

舉個簡單的例子,如下圖所示,7/4π 和 1/4π 統(tǒng)計均值,以傳統(tǒng)方法計算為 π,而利用方向統(tǒng)計就可以得到出均值為 0 的結果。

圖片

算法總流程設計

視頻的定義就是運動的畫面,但在屏幕共享當中,并不能夠將運動的畫面都當作視頻內容來處理。實際使用中,需要將部分運動的畫面識別為需要高清優(yōu)先、流暢度其次的屏幕內容,保證用戶在此時獲得清晰的觀看體驗。

  1. 探索性數(shù)據(jù)分析(EDA

在正式進行算法開發(fā)之前,先進行了探索性數(shù)據(jù)分析,分析發(fā)現(xiàn)屏幕的運動特征具有較高的區(qū)分度,從而大致判定利用光流法來完成該任務的特征提取是可行的。

圖片

圖片

  1. 算法流程圖

該檢測算法分成三個模塊,五個步驟。

三個模塊分別是:

  • 運動幅度分析:主要進行運動幅度相關特征的提取,能夠統(tǒng)計運動畫面比例,去除一些噪音。
  • 運動角度分析:主要進行運動角度相關特征的提取,能夠統(tǒng)計畫面運動的方向,以及運動方向的分散程度等
  • 紋理特征分析:主要提取一些紋理相關的特征,判定當前區(qū)域是否為文字區(qū)域。

具體分為五個步驟:

  • 采樣:光流算法需要前后兩幀數(shù)據(jù)進行計算,需要對視頻流進行采樣,得到兩幀數(shù)據(jù)
  • 光流計算:計算出全圖的稠密光流
  • 特征提?。禾崛∵\動和紋理特征
  • 狀態(tài)轉移:通過一系列模式和規(guī)則進行狀態(tài)轉移
  • 輸出結果:根據(jù)內部狀態(tài)信息輸出檢測結果

圖片

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 視頻會議
    +關注

    關注

    4

    文章

    159

    瀏覽量

    30240
  • RTC
    RTC
    +關注

    關注

    2

    文章

    544

    瀏覽量

    67081
收藏 人收藏

    評論

    相關推薦

    HarmonyOS實踐之應用狀態(tài)變量共享

    平時在開發(fā)的過程中,我們會在應用中共享數(shù)據(jù),在不同的頁面間共享信息。雖然常用的共享信息,也可以通過不同頁面中組件間信息共享的方式,但有時使用應用級別的狀態(tài)管理會讓開發(fā)工作變得簡單。 根
    發(fā)表于 12-27 09:48

    怎么共享屏幕給對方,可以選擇不同的屏幕共享軟件?

    、屏幕共享應用場景屏幕共享使用的場景一般是多臺電腦(或平板、手機)協(xié)同辦公。比如會議室內做培
    發(fā)表于 05-17 21:47

    高原環(huán)境TD-SCDMA網(wǎng)絡的優(yōu)化實踐,不看肯定后悔

    高原環(huán)境TD-SCDMA網(wǎng)絡的優(yōu)化實踐,不看肯定后悔
    發(fā)表于 05-28 06:57

    volatile關鍵字應用場景及示例

    volatile關鍵字1.應用場景2.示例1.應用場景volatile關鍵字分析,往往應用在三種場合1)多線程編程
    發(fā)表于 08-24 07:21

    MySql5.6性能優(yōu)化最佳實踐

    MySql5.6性能優(yōu)化最佳實踐
    發(fā)表于 09-08 08:47 ?13次下載
    MySql5.6性能<b class='flag-5'>優(yōu)化</b>最佳<b class='flag-5'>實踐</b>

    華為云在Kubernetes大規(guī)模場景的Service性能優(yōu)化實踐

    本文檔的主要內容詳細介紹的是華為云在Kubernetes大規(guī)模場景的Service性能優(yōu)化實踐包括了:1.Kubernetes的Servi
    發(fā)表于 06-21 08:00 ?0次下載
    華為云在Kubernetes大規(guī)模<b class='flag-5'>場景</b><b class='flag-5'>下</b>的Service性能<b class='flag-5'>優(yōu)化</b><b class='flag-5'>實踐</b>

    體驗共享含義及其與RTC技術的關系

    ,以及該如何應對這些挑戰(zhàn)。 大家好,我是邱國欽,本次與大家分享的是“體驗共享”。首先做一個人介紹,我大學畢業(yè)于通信專業(yè),而后進入騰訊從事互聯(lián)網(wǎng)軟件、QQ相關的工作,2015年進入即構科技負責SDK研發(fā),目前專注于整體解
    的頭像 發(fā)表于 04-29 17:34 ?1965次閱讀

    RTC互動語聊方案

    為了保證所有用戶“邊看邊聊、精彩共享”的核心體驗,“邊看邊聊”玩法選擇了“ RTC 互動語聊”的方案,即所有用戶都加入 RTC 房間,使用火山引擎 RTC 為支持超大型視頻會議、在線教
    的頭像 發(fā)表于 12-09 14:33 ?1246次閱讀

    淺析RTC技術及應用實踐

    RTC(Real-Time Communication)意為實時通信,是一項已發(fā)展十余年的技術,主要是以語音、視頻、網(wǎng)絡電話作為通信主體,通常不要求完全必達,以RTP/RTCP、UDP作為
    的頭像 發(fā)表于 05-26 16:38 ?3046次閱讀
    淺析<b class='flag-5'>RTC</b>技術及應用<b class='flag-5'>實踐</b>

    RTC 場景屏幕共享優(yōu)化實踐2

    屏幕共享是視頻會議場景使用最廣泛的功能之一,在共享一個 PPT 或者文檔的情況,人們對畫面清晰度有著極高的要求,“看不清” 是最容易被用戶
    的頭像 發(fā)表于 05-26 17:01 ?905次閱讀
    <b class='flag-5'>RTC</b> <b class='flag-5'>場景</b><b class='flag-5'>下</b>的<b class='flag-5'>屏幕</b><b class='flag-5'>共享</b><b class='flag-5'>優(yōu)化</b><b class='flag-5'>實踐</b>2

    屏幕共享詐騙怎么防?芯盾時代智能風控決策平臺(IRD)了解一?

    近期,屏幕共享詐騙在全國呈現(xiàn)爆發(fā)態(tài)勢。雖然各地警方接連不斷發(fā)布預警,各路媒體持續(xù)曝光宣傳,屏幕共享詐騙仍舊此起彼伏。隨便在搜索引擎、社交媒體上一搜,就會出現(xiàn)大批案例,讓人應接不暇。
    的頭像 發(fā)表于 10-08 15:55 ?778次閱讀
    <b class='flag-5'>屏幕</b><b class='flag-5'>共享</b>詐騙怎么防?芯盾時代智能風控決策平臺(IRD)了解一<b class='flag-5'>下</b>?

    谷歌發(fā)布Pixel手機3月功能更新,優(yōu)化應用屏幕共享和快速配對功能

    除對先前階段不足之處進行修復和增強系統(tǒng)穩(wěn)定性外,谷歌還將重點放在了擴大“圈選即搜”(Circle to Search)功能的覆蓋范圍、優(yōu)化應用屏幕共享和Fast Pair等功能上。
    的頭像 發(fā)表于 03-05 10:10 ?754次閱讀

    RTC時鐘芯片的特性及應用場景

    和應用場景: 主要特性 1 . 高精度時鐘與日歷功能 :FRTC8563基于穩(wěn)定的晶振工作,能夠提供準確的時鐘和日歷信息,包括年、月、日、星期、小時、分鐘和秒等。 2. 低功耗設計 :該芯片采用低功耗技術,使得在待機狀態(tài)功耗極
    的頭像 發(fā)表于 09-09 14:24 ?666次閱讀
    <b class='flag-5'>RTC</b>時鐘芯片的特性及應用<b class='flag-5'>場景</b>

    本源量子榮獲2024金融科技場景應用大賽“探索實踐獎”

    近期,在被譽為“中國金融改革發(fā)展風向標”的2024金融街論壇年會上,本源量子與中國郵政儲蓄銀行股份有限公司聯(lián)合申報的“真實量子計算環(huán)境,基于量子變分網(wǎng)絡的組合優(yōu)化方案”榮獲2024金融科技場景
    的頭像 發(fā)表于 10-23 08:05 ?376次閱讀
    本源量子榮獲2024金融科技<b class='flag-5'>場景</b>應用大賽“探索<b class='flag-5'>實踐</b>獎”

    hyper-v共享,hyper-v共享:實現(xiàn)主機與虛擬機之間高效文件共享的最佳實踐

    :實現(xiàn)主機與虛擬機之間高效文件共享的最佳實踐。 ? ?在企業(yè)級虛擬化環(huán)境中,實現(xiàn)主機與虛擬機之間的高效文件共享是提升資源利用率和協(xié)作效率的關鍵。Hyper-V提供了多種文件共享方法,能
    的頭像 發(fā)表于 01-24 14:23 ?226次閱讀
    hyper-v<b class='flag-5'>共享</b>,hyper-v<b class='flag-5'>共享</b>:實現(xiàn)主機與虛擬機之間高效文件<b class='flag-5'>共享</b>的最佳<b class='flag-5'>實踐</b>