四虎天堂va欧美ⅴa亚洲va,国产精品美色在线观看

一、總體介紹

1.1 背景介紹

Apache Spark是專(zhuān)為大規(guī)模數(shù)據(jù)計(jì)算而設(shè)計(jì)的快速通用的計(jì)算引擎，是一種與 Hadoop 相似的開(kāi)源集群計(jì)算環(huán)境，但是兩者之間還存在一些不同之處，這些不同之處使 Spark 在某些工作負(fù)載方面表現(xiàn)得更加優(yōu)越。換句話說(shuō)，Spark 啟用了內(nèi)存分布數(shù)據(jù)集，除了能夠提供交互式查詢外，它還可以優(yōu)化迭代工作負(fù)載。Spark SQL是Spark的計(jì)算模塊之一，專(zhuān)門(mén)用于處理結(jié)構(gòu)化的數(shù)據(jù)。Spark SQL允許用戶使用標(biāo)準(zhǔn)的SQL語(yǔ)句來(lái)執(zhí)行SQL的查詢和讀寫(xiě)，也可以使用Hive SQL來(lái)執(zhí)行對(duì)Hive倉(cāng)庫(kù)的查詢和讀寫(xiě)。

在Spark作業(yè)中，數(shù)據(jù)通常在內(nèi)存中進(jìn)行計(jì)算和操作，并且通過(guò)網(wǎng)絡(luò)進(jìn)行節(jié)點(diǎn)間的數(shù)據(jù)傳輸。Snappy壓縮算法已經(jīng)被廣泛應(yīng)用于各種大數(shù)據(jù)處理框架中，并且通常是默認(rèn)的壓縮選項(xiàng)。在Spark系統(tǒng)中，用戶無(wú)需額外的配置即可使用Snappy壓縮算法，這使得它成為Spark處理數(shù)據(jù)的首選壓縮方式之一。

Snappy壓縮算法是一種同時(shí)具備非常高的壓縮速度，和較為合理的壓縮率的壓縮算法。Snappy壓縮具有速度快、占用內(nèi)存小、通用性強(qiáng)的優(yōu)點(diǎn)，被廣泛應(yīng)用于大規(guī)模數(shù)據(jù)處理、網(wǎng)絡(luò)傳輸、數(shù)據(jù)庫(kù)存儲(chǔ)、機(jī)器學(xué)習(xí)、圖像處理等多個(gè)領(lǐng)域。

目前使用Snappy算法進(jìn)行壓縮解壓縮的場(chǎng)景全部基于CPU進(jìn)行，CPU除了需要維持整個(gè)計(jì)算場(chǎng)景的數(shù)據(jù)調(diào)度，還需要額外的算力進(jìn)行壓縮解壓縮計(jì)算。CPU作為通用處理芯片，在大數(shù)據(jù)高密集型的數(shù)據(jù)計(jì)算上并無(wú)明顯優(yōu)勢(shì)，這使得大部分應(yīng)用場(chǎng)景下基于CPU運(yùn)算時(shí)計(jì)算算力成為性能的主要瓶頸。

中科馭數(shù)自研的基于KPU架構(gòu)的DPU芯片作為專(zhuān)用的數(shù)據(jù)處理芯片，在處理復(fù)雜的數(shù)據(jù)計(jì)算時(shí)相比于CPU擁有極高的性能提升。因此將Snappy壓縮解壓縮算法由CPU卸載到DPU，可以極大的提升計(jì)算性能。在復(fù)雜場(chǎng)景下，CPU專(zhuān)注于數(shù)據(jù)傳遞和計(jì)算任務(wù)調(diào)度，DPU專(zhuān)注于壓縮解壓縮計(jì)算。

中科馭數(shù)HADOS是一款敏捷異構(gòu)軟件平臺(tái)，能夠?yàn)榫W(wǎng)絡(luò)、存儲(chǔ)、安全、大數(shù)據(jù)計(jì)算等場(chǎng)景進(jìn)行提速。對(duì)于大數(shù)據(jù)計(jì)算場(chǎng)景，HADOS可以認(rèn)為是一個(gè)異構(gòu)執(zhí)行庫(kù)，提供了數(shù)據(jù)類(lèi)型、向量數(shù)據(jù)結(jié)構(gòu)、表達(dá)式計(jì)算、IO和資源管理等功能。為了發(fā)揮CPU與DPU各自的性能優(yōu)勢(shì)，我們開(kāi)發(fā)了HADOS-RACE項(xiàng)目，結(jié)合HADOS平臺(tái)，既能夠發(fā)揮CPU高速穩(wěn)定的計(jì)算調(diào)度能力，又可以發(fā)揮DPU的向量化執(zhí)行能力。

我們通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)，Spark讀數(shù)據(jù)的解壓和寫(xiě)數(shù)據(jù)的壓縮過(guò)程，在耗時(shí)上占比比較高，將Snappy壓縮解壓縮的計(jì)算任務(wù)通過(guò)HADOS-RACE卸載到DPU上, 相比于純CPU計(jì)算，性能可提升約2倍。

本文將簡(jiǎn)單介紹基于DPU的Snappy壓縮解壓縮計(jì)算原理，并介紹如何基于DPU和HADOS-RACE來(lái)加速Snappy壓縮解壓縮計(jì)算，為大規(guī)模數(shù)據(jù)分析和處理提供更可靠的解決方案。

1.2 挑戰(zhàn)和困難

在數(shù)據(jù)處理和傳輸?shù)念I(lǐng)域，快速且高效的壓縮算法對(duì)于提高系統(tǒng)性能至關(guān)重要。然而，盡管Snappy壓縮解壓縮算法以其快速的壓縮和解壓縮速度而聞名，但其卻存在一個(gè)不容忽視的挑戰(zhàn)，即對(duì)CPU和內(nèi)存資源的大量占用，從而導(dǎo)致性能下降的問(wèn)題。

Snappy算法在壓縮和解壓縮數(shù)據(jù)時(shí)需要進(jìn)行復(fù)雜的計(jì)算和處理。雖然它以其高效的算法設(shè)計(jì)和優(yōu)化而著稱，但在處理大量數(shù)據(jù)時(shí)，仍會(huì)對(duì)CPU提出較高的要求。特別是在需要快速壓縮或解壓縮大文件時(shí)，Snappy算法的CPU消耗可能會(huì)變得更為顯著，從而導(dǎo)致系統(tǒng)整體性能的下降。對(duì)于CPU性能較低的系統(tǒng)而言，這一挑戰(zhàn)尤為嚴(yán)峻，可能導(dǎo)致系統(tǒng)響應(yīng)變慢，甚至造成任務(wù)阻塞和性能瓶頸。

綜上所述，Snappy壓縮解壓縮算法的高效性和速度帶來(lái)了性能優(yōu)勢(shì)，但其對(duì)CPU的大量占用也成為其性能低下的一個(gè)主要挑戰(zhàn)。

二、整體方案

圖一：Spark基于DPU Snappy壓縮算法的異構(gòu)加速整體方案

上圖所示為Spark SQL的一個(gè)涉及FileScan、Shuffle、Aggregate、OrderBy計(jì)算的完整數(shù)據(jù)流轉(zhuǎn)過(guò)程，Spark SQL的數(shù)據(jù)處理首先需要讀取HDFS分布式文件存儲(chǔ)系統(tǒng)中的Snappy壓縮文件，然后會(huì)對(duì)Snappy壓縮文件進(jìn)行解壓縮處理，從而得到計(jì)算所需的數(shù)據(jù)。拿到數(shù)據(jù)后根據(jù)SQL的邏輯進(jìn)行相應(yīng)的計(jì)算，常見(jiàn)的計(jì)算比如Filter、Aggregate、Join、Order By等，經(jīng)過(guò)數(shù)據(jù)計(jì)算拿到想要輸出的結(jié)果數(shù)據(jù)。最后會(huì)將結(jié)果數(shù)據(jù)寫(xiě)出并按Snappy格式進(jìn)行壓縮，得到的壓縮文件會(huì)寫(xiě)回到HDFS中存儲(chǔ)。

圖二：基于DPU的算子卸載加速流程

上圖所示為Spark將算子卸載到DPU進(jìn)行計(jì)算的一個(gè)通用流程。首先Spark將SQL進(jìn)行解析并得到最終的物理執(zhí)行計(jì)劃，然后將物理執(zhí)行計(jì)劃轉(zhuǎn)化為具體的算子操作，Spark會(huì)通過(guò)HADOS-RACE Plugin將具體算子卸載到DPU進(jìn)行處理。在DPU處理過(guò)程中，首先需要執(zhí)行FileScan算子，將數(shù)據(jù)從HDFS文件系統(tǒng)中讀取出來(lái)并對(duì)Snappy壓縮文件執(zhí)行解壓縮操作。中間過(guò)程是對(duì)解壓縮的數(shù)據(jù)進(jìn)行計(jì)算，得到最終的結(jié)果數(shù)據(jù)。最后會(huì)將結(jié)果數(shù)據(jù)按Snappy格式壓縮并導(dǎo)出到HDFS中存儲(chǔ)。

在對(duì)整個(gè)Spark計(jì)算過(guò)程進(jìn)行性能分析后，發(fā)現(xiàn)Snappy壓縮和解壓縮是兩個(gè)耗時(shí)非常高的過(guò)程，占整個(gè)計(jì)算過(guò)程的比重較高。因此我們需要對(duì)Snappy的壓縮和解壓縮過(guò)程進(jìn)行加速。

我們采用軟硬件結(jié)合的方式，在數(shù)據(jù)壓縮解壓縮鏈路的軟硬件兩大方面都進(jìn)行了全面提升和加速。

在軟件方面，基于硬件對(duì)不同場(chǎng)景、數(shù)據(jù)量的壓縮解壓縮表現(xiàn)，HADOS-RACE可以靈活選擇合適的壓縮、解壓縮的硬件平臺(tái)。

在硬件方面，自研的DPU計(jì)算引擎擁有強(qiáng)大的Snappy壓縮、解壓縮能力，滿足日益復(fù)雜的計(jì)算場(chǎng)景。

三、核心加速階段

圖三：基于DPU的整體加速流程圖

加速階段如上圖所示，核心數(shù)據(jù)加速方案分為兩個(gè)階段，分別為 1.智能壓縮解壓縮策略選擇階段；2.對(duì)數(shù)據(jù)壓縮解壓縮階段。

3.1 策略選擇階段

3.1.1 面臨挑戰(zhàn)

在數(shù)據(jù)壓縮解壓縮過(guò)程中，壓縮解壓縮策略選擇階段是整個(gè)過(guò)程的開(kāi)始。傳統(tǒng)的硬件體系結(jié)構(gòu)中，數(shù)據(jù)的壓縮和解壓縮過(guò)程通常只能依賴CPU完成，沒(méi)有其他策略可以選擇，從而無(wú)法利用GPU、DPU等其他處理器資源。這種局限性導(dǎo)致數(shù)據(jù)壓縮解壓縮過(guò)程會(huì)大量占用CPU資源，從而降低系統(tǒng)的性能。

3.1.2 解決方案與原理

近年來(lái)，隨著數(shù)據(jù)處理領(lǐng)域的不斷發(fā)展和硬件技術(shù)的進(jìn)步，DPU、GPU等計(jì)算資源的加入為數(shù)據(jù)壓縮解壓縮帶來(lái)了新的可能性。這些不同的硬件平臺(tái)具有各自獨(dú)特的特點(diǎn)和優(yōu)勢(shì)，可以根據(jù)不同的場(chǎng)景和需求來(lái)選擇合適的硬件平臺(tái)進(jìn)行數(shù)據(jù)壓縮解壓縮。

HADOS-RACE的IO模塊負(fù)責(zé)將數(shù)據(jù)從硬盤(pán)讀入內(nèi)存中，并將其交由Compressor模塊進(jìn)行卸載策略判斷。通過(guò)IO模塊的數(shù)據(jù)加載過(guò)程，系統(tǒng)能夠根據(jù)數(shù)據(jù)的特點(diǎn)和硬件平臺(tái)的性能選擇合適的壓縮解壓縮策略，從而實(shí)現(xiàn)數(shù)據(jù)處理的優(yōu)化和提升。

在HADOS-RACE中，基于硬件對(duì)不同場(chǎng)景、數(shù)據(jù)量的性能表現(xiàn)，可以靈活配置壓縮解壓縮策略。例如，當(dāng)數(shù)據(jù)量比較小的時(shí)候，可以直接通過(guò)CPU進(jìn)行壓縮解壓縮，減少了內(nèi)存和DPU硬件之間的數(shù)據(jù)傳輸，從而提高了系統(tǒng)的性能和效率。而對(duì)于大規(guī)模數(shù)據(jù)處理的場(chǎng)景，可以利用DPU等硬件資源進(jìn)行并行計(jì)算，加速數(shù)據(jù)的處理速度。

3.1.3 優(yōu)勢(shì)與效果

HADOS-RACE的智能策略選擇模塊在數(shù)據(jù)加載過(guò)程中發(fā)揮了重要作用，通過(guò)分析數(shù)據(jù)的特征和硬件平臺(tái)的性能，實(shí)現(xiàn)了對(duì)壓縮解壓縮策略的選擇。這種靈活配置的策略不僅提高了數(shù)據(jù)處理的效率，也降低了系統(tǒng)的資源消耗，為數(shù)據(jù)處理和應(yīng)用提供了更好的支持。

我們可以根據(jù)一定的策略選擇合適的硬件平臺(tái)來(lái)進(jìn)行數(shù)據(jù)壓縮解壓縮，從而實(shí)現(xiàn)數(shù)據(jù)壓縮解壓縮的優(yōu)化和提升。這為未來(lái)的數(shù)據(jù)壓縮解壓縮領(lǐng)域的發(fā)展帶來(lái)了新的機(jī)遇和挑戰(zhàn)，也為用戶提供了更加靈活和高效的數(shù)據(jù)壓縮解壓縮方案。

3.2 壓縮解壓縮階段

3.2.1 面臨挑戰(zhàn)

由于CPU在數(shù)據(jù)處理方面具有較強(qiáng)的通用性和靈活性，因此壓縮解壓縮算法通常被設(shè)計(jì)為在CPU上執(zhí)行。然而，與DPU相比，CPU的并行處理能力相對(duì)較弱，無(wú)法充分發(fā)揮硬件資源的潛力。在大規(guī)模數(shù)據(jù)處理的場(chǎng)景下，數(shù)據(jù)壓縮解壓縮過(guò)程可能成為CPU的瓶頸，導(dǎo)致系統(tǒng)性能下降。此外，由于數(shù)據(jù)壓縮解壓縮是一個(gè)計(jì)算密集型任務(wù)，當(dāng)系統(tǒng)中同時(shí)存在其他需要CPU資源的任務(wù)時(shí)，壓縮解壓縮過(guò)程可能會(huì)與其他任務(wù)產(chǎn)生競(jìng)爭(zhēng)，進(jìn)一步加劇了CPU資源的緊張程度，導(dǎo)致系統(tǒng)整體的響應(yīng)速度變慢。

3.2.2 解決方案與原理

在傳統(tǒng)的硬件體系結(jié)構(gòu)中，數(shù)據(jù)的壓縮和解壓縮過(guò)程通常只能依賴CPU完成。然而，隨著芯片技術(shù)的不斷發(fā)展和創(chuàng)新，現(xiàn)代計(jì)算機(jī)系統(tǒng)已經(jīng)實(shí)現(xiàn)了DPU等計(jì)算資源的利用，從而在數(shù)據(jù)處理領(lǐng)域帶來(lái)了革命性的變化。DPU的并行計(jì)算能力遠(yuǎn)遠(yuǎn)超過(guò)CPU，使得它成為處理大規(guī)模數(shù)據(jù)的理想選擇。近年來(lái)，隨著DPU技術(shù)的日益成熟和運(yùn)用，數(shù)據(jù)壓縮解壓縮過(guò)程已經(jīng)可以借助DPU來(lái)執(zhí)行，從而大大減少了對(duì)CPU資源的占用，提升了系統(tǒng)的性能和效率。

隨著DPU芯片技術(shù)的不斷發(fā)展和成熟，DPU已經(jīng)成為了處理大規(guī)模數(shù)據(jù)的強(qiáng)大工具。DPU的并行計(jì)算能力遠(yuǎn)遠(yuǎn)超過(guò)CPU，能夠同時(shí)處理大量數(shù)據(jù)，極大地加快了數(shù)據(jù)處理的速度。因此，現(xiàn)在可以利用DPU來(lái)執(zhí)行數(shù)據(jù)的壓縮和解壓縮過(guò)程，從而減少了對(duì)CPU資源的占用，提升了系統(tǒng)的性能和效率。

3.2.3 優(yōu)勢(shì)與效果

DPU在數(shù)據(jù)壓縮解壓縮中的應(yīng)用，主要體現(xiàn)在以下幾個(gè)方面：

首先，DPU能夠同時(shí)處理多個(gè)數(shù)據(jù)塊，實(shí)現(xiàn)真正的并行計(jì)算。在數(shù)據(jù)壓縮解壓縮過(guò)程中，可以將大規(guī)模數(shù)據(jù)劃分成多個(gè)小塊，然后通過(guò)DPU同時(shí)對(duì)這些數(shù)據(jù)塊進(jìn)行壓縮或解壓縮，極大地提高了處理速度。

此外，DPU的計(jì)算能力可以輕松處理大規(guī)模數(shù)據(jù)，從而滿足了現(xiàn)代大數(shù)據(jù)處理的需求?？梢岳肈PU來(lái)執(zhí)行數(shù)據(jù)的壓縮和解壓縮過(guò)程，從而提高系統(tǒng)的性能和效率。

綜上所述，利用DPU進(jìn)行數(shù)據(jù)壓縮解壓縮等算力的卸載，已經(jīng)成為了計(jì)算機(jī)系統(tǒng)的重要趨勢(shì)。通過(guò)充分利用DPU的并行計(jì)算能力和卡上內(nèi)存，可以大大減少對(duì)CPU資源的占用，提升系統(tǒng)的性能和效率。相信在未來(lái)的snappy數(shù)據(jù)壓縮解壓縮領(lǐng)域，DPU將會(huì)發(fā)揮越來(lái)越重要的作用。

四、加速效果

基于目前HADOS-RACE已經(jīng)實(shí)現(xiàn)的Snappy壓縮解壓縮方案，制定了對(duì)應(yīng)的性能測(cè)試計(jì)劃。首先生成snappy測(cè)試數(shù)據(jù)，使用基于CPU和DPU的Spark分別對(duì)數(shù)據(jù)進(jìn)行處理，記錄各自的Snappy壓縮解壓縮階段和Spark整體端到端的耗時(shí)和吞吐。執(zhí)行的測(cè)試語(yǔ)句為：select * from table where a1 is not null and a2 is not null（盡量減少中間的計(jì)算過(guò)程，突出Snappy壓縮解壓縮的過(guò)程）。

4.1 壓縮解壓縮加速效果

單獨(dú)分析Snappy壓縮解壓縮階段，基于CPU的Snappy解壓縮，吞吐量為300MB/s。而將解壓縮任務(wù)卸載到DPU后，DPU核內(nèi)計(jì)算的吞吐量可達(dá)到1585MB/s。可以看到，基于DPU進(jìn)行Snappy解壓縮，相比基于CPU進(jìn)行Snappy解壓縮，性能可提升約5倍。

對(duì)于系統(tǒng)整體而言，壓縮解壓縮計(jì)算的輸入數(shù)據(jù)和輸出數(shù)據(jù)，如果需要傳輸?shù)紺PU繼續(xù)做計(jì)算，則有額外的PCIe數(shù)據(jù)傳輸?shù)臅r(shí)間損耗，由于不同的數(shù)據(jù)量及壓縮比帶來(lái)的整體效果差別較大，所以以下測(cè)試數(shù)據(jù)僅供參考。表格中的DPU數(shù)據(jù)均為結(jié)合PCIe傳輸消耗的結(jié)果。壓縮前的數(shù)據(jù)量均為128MB，但是由于數(shù)據(jù)內(nèi)容不同導(dǎo)致壓縮比不同，進(jìn)而導(dǎo)致吞吐的不同，從以下測(cè)試結(jié)果中可以看出，壓縮率越大，計(jì)算占比越高，DPU表現(xiàn)的越好。

圖四：基于DPU的Snappy壓縮解壓縮方案測(cè)試結(jié)果

4.2 端到端整體加速效果

基于CPU的Spark計(jì)算過(guò)程總體比基于DPU的Spark計(jì)算過(guò)程耗時(shí)減少了約50%。相當(dāng)于基于DPU的端到端執(zhí)行性能是基于CPU端到端性能的兩倍。詳細(xì)測(cè)試結(jié)果如下所示：

圖五：基于DPU加速的端到端方案測(cè)試結(jié)果

4.3 結(jié)果分析

從測(cè)試結(jié)果中可以看到，在壓縮率約為50%至70%時(shí)，基于DPU進(jìn)行Snappy解壓縮相比基于CPU進(jìn)行Snappy解壓縮，性能有1.1至1.5倍提升，其他情況下解壓縮性能均有下降。造成這一現(xiàn)象的原因是，此次測(cè)試沒(méi)有對(duì)DPU進(jìn)行流程優(yōu)化，從主機(jī)向DPU板卡傳輸數(shù)據(jù)時(shí)，DPU并沒(méi)有并發(fā)執(zhí)行計(jì)算任務(wù)。DPU的計(jì)算流程還有著極大的優(yōu)化空間，優(yōu)化后，DPU中的計(jì)算任務(wù)可以以流水線的形式進(jìn)行調(diào)度，則數(shù)據(jù)傳輸過(guò)程將不會(huì)占用整體計(jì)算時(shí)間。

從Spark整個(gè)執(zhí)行過(guò)程來(lái)看，基于DPU的Spark計(jì)算過(guò)程總體比基于CPU的Spark計(jì)算過(guò)程有2倍的性能提升。單獨(dú)從Snappy壓縮解壓縮階段看，在壓縮率20%至100%之間，基于DPU的Snappy解壓縮，相比于基于CPU的Snappy解壓縮，性能上可以有1.5至5倍的性能提升。

五、未來(lái)規(guī)劃

5.1 現(xiàn)有優(yōu)勢(shì)

性能方面，得益于DPU做算力卸載的高效性和智能策略選擇算法，相對(duì)于傳統(tǒng)壓縮解壓縮方式，基于DPU進(jìn)行snappy壓縮解壓縮具備較為明顯的性能優(yōu)勢(shì)。

資源占用方面，得益于將CPU的計(jì)算卸載到DPU上執(zhí)行，服務(wù)器的CPU、內(nèi)存、IO和網(wǎng)絡(luò)資源占用等方面都有明顯降低。特別是CPU資源，可以將壓縮解壓縮卸載到DPU的同時(shí)完成其他數(shù)據(jù)計(jì)算處理任務(wù)。

5.2 未來(lái)規(guī)劃

優(yōu)化和完善現(xiàn)有功能，繼續(xù)增加其他算力的卸載。

未來(lái)計(jì)劃在存算分離場(chǎng)景下適配snappy壓縮解壓縮功能。從遠(yuǎn)端讀取數(shù)據(jù)后，首先數(shù)據(jù)會(huì)直接經(jīng)過(guò)壓縮或解壓縮計(jì)算，從DPU卡出來(lái)的數(shù)據(jù)已經(jīng)是經(jīng)過(guò)壓縮解壓縮的，無(wú)需多余的數(shù)據(jù)傳輸和計(jì)算。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4631

瀏覽量
93400
SQL

SQL

+關(guān)注

關(guān)注
1

文章
775

瀏覽量
44262
DPU

DPU

+關(guān)注

關(guān)注
0

文章
368

瀏覽量
24266
SPARK

SPARK

+關(guān)注

關(guān)注
1

文章
105

瀏覽量
19983

評(píng)論

相關(guān)推薦

利用NVIDIA DPF引領(lǐng)DPU加速云計(jì)算的未來(lái)

DPU 的強(qiáng)大功能，并優(yōu)化 GPU 加速計(jì)算平臺(tái)。作為一種編排框架和實(shí)施藍(lán)圖，DPF 使開(kāi)發(fā)者、服務(wù)提供商和企業(yè)能夠無(wú)縫構(gòu)建 BlueField 加速的云原生軟件平臺(tái)。

發(fā)表于 01-24 09:29 ?222次閱讀

利用NVIDIA DPF引領(lǐng)<b class='flag-5'>DPU</b><b class='flag-5'>加速</b>云計(jì)算的未來(lái)

EE-257：面向Blackfin處理器的引導(dǎo)壓縮/解壓縮算法

電子發(fā)燒友網(wǎng)站提供《EE-257：面向Blackfin處理器的引導(dǎo)壓縮/解壓縮算法.pdf》資料免費(fèi)下載

發(fā)表于 01-07 13:56 ?0次下載

EE-257：面向Blackfin處理器的引導(dǎo)<b class='flag-5'>壓縮</b>/解<b class='flag-5'>壓縮</b><b class='flag-5'>算法</b>

【BearPi-Pico H3863星閃開(kāi)發(fā)板體驗(yàn)連載】LZO壓縮算法移植

壓縮算法使用一、概述壓縮算法是一類(lèi)用于減小數(shù)據(jù)大小的計(jì)算方法，它們?cè)跀?shù)據(jù)存儲(chǔ)和傳輸領(lǐng)域扮演著重要角色。壓縮

發(fā)表于 11-10 21:45

壓縮算法的類(lèi)型和應(yīng)用

壓縮算法是一種通過(guò)減少數(shù)據(jù)量來(lái)節(jié)省存儲(chǔ)空間或傳輸數(shù)據(jù)的技術(shù)。壓縮算法可以分為兩種類(lèi)型：有損壓縮和無(wú)損壓縮

發(fā)表于 10-21 13:50 ?365次閱讀

Huffman壓縮算法概述和詳細(xì)流程

Huffman壓縮算法是一種基于字符出現(xiàn)頻率的編碼算法，通過(guò)構(gòu)建Huffman樹(shù)，將出現(xiàn)頻率高的字符用短編碼表示，出現(xiàn)頻率低的字符用長(zhǎng)編碼表示，從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的壓縮。

發(fā)表于 10-21 13:48 ?335次閱讀

IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書(shū)

、VMware、Palo Alto 等公司紛紛推出相關(guān)解決方案。這些方案背后共同的本質(zhì)思想是：將云計(jì)算的 IaaS 層組件從服務(wù)器側(cè)卸載后圍繞 DPU 構(gòu)筑高性能算力底座，與 AWS、阿里云的技術(shù)路線不謀而合

發(fā)表于 07-24 15:32

spark運(yùn)行的基本流程

前言：由于最近對(duì)spark的運(yùn)行流程非常感興趣，所以閱讀了《Spark大數(shù)據(jù)處理：技術(shù)、應(yīng)用與性能優(yōu)化》一書(shū)。通過(guò)這本書(shū)的學(xué)習(xí)，了解了spark的核心技術(shù)、實(shí)際應(yīng)用場(chǎng)景以及性能優(yōu)化的方法。本文旨在

發(fā)表于 07-02 10:31 ?487次閱讀

Spark基于DPU的Native引擎算子卸載方案

1.背景介紹 Apache Spark（以下簡(jiǎn)稱Spark）是一個(gè)開(kāi)源的分布式計(jì)算框架，由UC Berkeley AMP Lab開(kāi)發(fā)，可用于批處理、交互式查詢（Spark SQL）、實(shí)時(shí)流處理

發(fā)表于 06-28 17:12 ?766次閱讀

“Spark+Hive”在DPU環(huán)境下的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫(kù)引擎選型白皮書(shū)（24版）DPU部分節(jié)選

在奇點(diǎn)云2024年版《OLAP數(shù)據(jù)庫(kù)引擎選型白皮書(shū)》中，中科馭數(shù)聯(lián)合奇點(diǎn)云針對(duì)Spark+Hive這類(lèi)大數(shù)據(jù)計(jì)算場(chǎng)景下的主力引擎，測(cè)評(píng)DPU環(huán)境下對(duì)比CPU環(huán)境下的性能提升效果。特此節(jié)選該章節(jié)內(nèi)容，與大家共享。

發(fā)表于 05-30 16:09 ?589次閱讀

FPGA壓縮算法有哪些

在圖像壓縮算法中可以采用哈夫曼編碼的方式對(duì)編碼冗余的信息進(jìn)行壓縮，可以采用預(yù)測(cè)的方式來(lái)減少像素間冗余，可以采用量化的方式完成心理視覺(jué)冗余信息的去除

發(fā)表于 04-15 11:48 ?719次閱讀

基于門(mén)控線性網(wǎng)絡(luò)（GLN）的高壓縮比無(wú)損醫(yī)學(xué)圖像壓縮算法

實(shí)現(xiàn)基于門(mén)控線性網(wǎng)絡(luò)（GLN）的高壓縮比無(wú)損醫(yī)學(xué)圖像壓縮算法，以提高醫(yī)學(xué)圖像存儲(chǔ)和分發(fā)系統(tǒng)的效率。與“傳統(tǒng)”的基于上下文的數(shù)據(jù)壓縮算法相比，

發(fā)表于 04-08 10:29 ?742次閱讀

明天線上見(jiàn)！DPU構(gòu)建高性能云算力底座——DPU技術(shù)開(kāi)放日最新議程公布！

算力，是數(shù)字經(jīng)濟(jì)時(shí)代的新質(zhì)生產(chǎn)力。隨著人工智能、智算中心建設(shè)等需求不斷拓展，DPU在各行各業(yè)數(shù)據(jù)中心的應(yīng)用逐步深入。異構(gòu)算力代表DPU在新質(zhì)生產(chǎn)力建設(shè)中，能否給出別開(kāi)生面的答案，應(yīng)戰(zhàn)算力難題？

發(fā)表于 04-03 18:12 ?1040次閱讀

如何利用DPU加速Spark大數(shù)據(jù)處理？ | 總結(jié)篇

SSD速度通過(guò)NVMe接口得到了大幅提升，并且網(wǎng)絡(luò)傳輸速率也進(jìn)入了新的高度，但CPU主頻發(fā)展并未保持同等步調(diào)，3GHz左右的核心頻率已成為常態(tài)。在當(dāng)前背景下Apache Spark等大數(shù)據(jù)處理工具中，盡管存儲(chǔ)和網(wǎng)絡(luò)性能的提升極大地減少了數(shù)據(jù)讀取和傳輸?shù)臅r(shí)間消耗，但

發(fā)表于 04-02 13:45 ?1126次閱讀

中科馭數(shù)DPU技術(shù)開(kāi)放日秀“肌肉”：云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相

DPU技術(shù)開(kāi)放日既是對(duì)DPU技術(shù)應(yīng)用的典型方案展示，也是DPU技術(shù)在重要細(xì)分場(chǎng)景走向成熟的標(biāo)志。

發(fā)表于 04-01 11:48 ?850次閱讀

基于DPU和HADOS-RACE加速Spark 3.x

背景簡(jiǎn)介 Apache Spark（下文簡(jiǎn)稱Spark）是一種開(kāi)源集群計(jì)算引擎，支持批/流計(jì)算、SQL分析、機(jī)器學(xué)習(xí)、圖計(jì)算等計(jì)算范式，以其強(qiáng)大的容錯(cuò)能力、可擴(kuò)展性、函數(shù)式API、多語(yǔ)言支持（SQL

發(fā)表于 03-25 18:12 ?1429次閱讀