Redis之父的大語言模型編程實踐

作者 | Antirez? ? ? ? ?

首先我要明確，這篇文章并不旨在回顧大語言模型。顯而易見，2023 年對人工智能來說是不平凡的一年，再去強調(diào)這一點似乎沒有多大必要。這篇文章更多是作為一位程序員的個人體驗分享。

自從 ChatGPT 出現(xiàn)，再到使用本地運行的大語言模型，我就開始廣泛應(yīng)用這項新技術(shù)。我的目標不僅僅是提高編碼效率，更重要的是，我不想在編程中那些無需過多精力投入的地方浪費時間。不愿意花費大量時間去查找某些專業(yè)且無趣的文檔，不想為了學習一些過于復(fù)雜且往往無需如此的 API 而勞心費力，也不想編寫那些幾小時后就會被我拋棄的臨時代碼。尤其是如今 Google 成了一個充斥著垃圾信息的海洋，我們只能在其中努力尋找那少數(shù)有用信息。

同時，我也不是編程領(lǐng)域的新手。我完全有能力在沒有任何輔助的情況下編寫代碼，而且我也常常這么做。隨著時間的推移，我越來越頻繁地借助大語言模型來編寫高級代碼，特別是 Python 代碼，而在 C 語言方面則相對少一些。在體驗大語言模型的過程中，我深刻認識到，應(yīng)該在何時使用它們，以及何時它們的使用反而會拖慢我的步伐。我還了解到，大語言模型有點類似于維基百科和 YouTube 上琳瑯滿目的視頻課程：它們對那些有意愿、有能力和自律的人大有裨益，但對于其他人來說，幫助有限。我擔心，至少在初始階段，它們更多的是惠及那些本就占據(jù)優(yōu)勢的人。但我們還是一步一個腳印來吧！

全知全能還是鸚鵡學舌？ ? 在機器學習新浪潮中，最讓人擔憂的是 AI 專家們難以接受自己知識的局限性。人類發(fā)明了神經(jīng)網(wǎng)絡(luò)，更關(guān)鍵的是，還發(fā)明了一個自動優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)的算法。隨著硬件能力的提升，能夠訓練更大的模型，利用數(shù)據(jù)的統(tǒng)計知識（即先驗知識），通過不斷的嘗試和錯誤，逐漸找到了一些比其他架構(gòu)更有效的模型設(shè)計。但不管怎樣，神經(jīng)網(wǎng)絡(luò)本質(zhì)上還是相當復(fù)雜且不透明的。

面對大語言模型一些新的無法解釋的能力，謹慎的科學家們反而低估了它們。許多人認為，大語言模型不過是稍微高級點的馬爾科夫鏈 (Markov chains)，最多只能重復(fù)訓練集里有限變化的內(nèi)容。然而，越來越多的證據(jù)表明，這種看法幾乎可能是大錯特錯的。同時，很多吃瓜群眾過分夸大了大語言模型的能力，認為它們擁有現(xiàn)實中根本不存在的超自然力量。事實上，大語言模型最多只能在其訓練數(shù)據(jù)所代表的空間內(nèi)進行插值，即使如此，它們的這一能力也已經(jīng)相當驚人。真要是今天的大語言模型能夠在看過的所有代碼構(gòu)成的空間內(nèi)自如插值，它們即便不能創(chuàng)造真正的新穎事物，也足以取代 99% 的程序員。但現(xiàn)實情況要并沒有這么樂觀。大語言模型確實可以編寫一些它之前未曾見過的程序，展示出將不同思想的訓練數(shù)據(jù)融合的能力，但這種能力目前還有很大的限制，尤其是在需要細膩推理時，它們往往無法勝任。盡管如此，它們?nèi)源碇鴱娜斯ぶ悄苷Q生至今的最偉大成就，這一點似乎無庸置疑。

無知卻博學 ? 確實，大語言模型大體上只能進行初級的推理，這些推理經(jīng)常不準確，甚至會摻雜著一些關(guān)于不存在事實的幻覺。但它們卻擁有海量的知識。在編程領(lǐng)域，以及其他有高質(zhì)量數(shù)據(jù)的領(lǐng)域，大語言模型就像是理解力有限卻知識淵博的人。如果要和這樣的伙伴進行結(jié)對編程（對我來說，結(jié)對編程本身就是個痛苦），可能會很糟糕：它們可能提出一些荒謬的想法，我們需要不斷斗爭才能貫徹我們自己的想法。但如果這個博學的傻瓜能夠聽從我們的指令，回答我們提出的所有問題，那一切都會變得不同。現(xiàn)有的大語言模型雖然不能引領(lǐng)我們超越已知的路徑，但如果我們想探索一個不熟悉的領(lǐng)域，它們往往能夠幫我們從一無所知到掌握足夠的知識來獨立前行。在編程領(lǐng)域，直到二十或三十年前，這些能力可能還不太引人注目。

那時，你需要掌握幾種編程語言、經(jīng)典算法以及那些基本的庫。其余的則依靠你自己的智慧、專業(yè)知識和設(shè)計能力。具備這些素質(zhì)，你就能成為一名全能的專家級程序員。然而，隨著時間的推移，我們見證了框架、編程語言、各種庫的大量涌現(xiàn)。這種復(fù)雜性通常是不必要的，甚至無法自圓其說，但事實就是如此。在這樣的情況下，一個無所不知的“白癡”成了寶貴的盟友。我來舉個例子：我對機器學習的實驗最初是用 Keras 進行的，持續(xù)了至少一年。后來因各種原因，我轉(zhuǎn)向了 PyTorch。我已經(jīng)了解什么是嵌入（Embedding）或殘差網(wǎng)絡(luò)（Residual Networks, ResNets），但我并不想深入研究 PyTorch 的文檔（就像我學習 Keras 那樣，那時 ChatGPT 還不存在）。有了大語言模型，用 Torch 編寫 Python 代碼變得非常容易。我只需清楚地了解我想要構(gòu)建的模型，并提出合適的問題。

應(yīng)用案例 ? 我要討論的不是那些簡單的問題，比如“嘿，類 X 是如何執(zhí)行 Y 操作的？”如果只是這些問題，那些對大語言模型保持懷疑態(tài)度的人可能就有理由了。但實際上，更復(fù)雜的模型能做的事情遠遠超出這些。幾年前，這些還被認為是不可思議的魔法。我可以這樣對 GPT4 下指令：看，這是我在 PyTorch 中實現(xiàn)的神經(jīng)網(wǎng)絡(luò)模型。這里是我的數(shù)據(jù)批次。我想調(diào)整這些張量的大小，以便它們能與神經(jīng)網(wǎng)絡(luò)輸入的要求相匹配，并且我希望以這種特別的方式展現(xiàn)它們。你能幫我寫出調(diào)整這些張量尺寸的代碼嗎？GPT4 幫我寫出了代碼，我接下來要做的，就是在 Python 命令行界面中測試這些張量是否真的符合我需要的大小，以及數(shù)據(jù)結(jié)構(gòu)是否正確。再舉一個例子。不久前，我需要為基于 ESP32 的設(shè)備開發(fā)一個藍牙低能耗 (BLE) 客戶端。經(jīng)過研究后，我發(fā)現(xiàn)多平臺藍牙編程接口大都不好用。解決方法很簡單，就是用 Objective C 和 macOS 的原生 API 來編寫代碼。但這樣一來，我就面臨著兩個問題：一是學習 Objective C 中復(fù)雜的 BLE API，這些 API 充滿了我認為完全沒有必要的復(fù)雜設(shè)計（作為一個極簡主義者，這些設(shè)計與我所認為的“好設(shè)計”截然相反）；二是回憶起怎樣使用 Objective C 編程。我上次使用 Objective C 編寫程序是十年前了，很多細節(jié)，比如事件循環(huán)、內(nèi)存管理等，我都已經(jīng)記不清了。最后的結(jié)果就是這段代碼，雖然它看起來不是很美觀，但它完成了它的任務(wù)。我在極短的時間內(nèi)就編寫完成了。否則根本不可能做到這一點。 https://github.com/antirez/freakwan/blob/main/osx-bte-cli/SerialBTE.m 這段代碼主要是通過在 ChatGPT 上復(fù)制粘貼我想實現(xiàn)但不太確定如何著手的功能來編寫的，因此最初它們并未能正確運行。

然后，大語言模型幫我指出了問題所在并告訴我如何解決。雖然大部分代碼不是由 LLM 直接編寫的，但它確實極大地加快了編程速度。不用 ChatGPT 我也能完成這個任務(wù)嗎？答案是肯定的，但更有趣的不僅是它節(jié)省了我很多時間：事實上，如果沒有 ChatGPT，我連嘗試的勇氣都沒有，因為那似乎并不值得。這一點至關(guān)重要。對于我的項目來說，編寫這樣一個不重要的程序的努力與其帶來的好處的比例本來是不劃算的。此外，這個過程產(chǎn)生了一個比程序本身更有用的副作用：為了這個項目，我對 linenoise（我用于行編輯的一個庫）進行了改造，使其可以在多路復(fù)用環(huán)境下運行。這是另一個例子，更多地涉及到數(shù)據(jù)解釋而非代碼編寫。我打算用一個我在網(wǎng)上發(fā)現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neural Network) 設(shè)置一個 Python 腳本，但這個網(wǎng)絡(luò)缺乏詳細文檔。網(wǎng)絡(luò)的一大優(yōu)勢是它采用了 ONNX (Open Neural Network Exchange) 格式，這使我能夠輕松地識別出網(wǎng)絡(luò)的輸入和輸出以及它們對應(yīng)的名稱。我對這個卷積網(wǎng)絡(luò)了解的唯一一點是：它能識別圖像中的特定特征。但我不知道所需輸入圖像的格式和大小，更何況，網(wǎng)絡(luò)的輸出比我預(yù)想的要復(fù)雜得多（我原本以為它是一個二元分類器 (binary classifier)，用于判斷觀察到的圖像是否正常或存在問題。

我原以為它只有兩個輸出，但實際上有數(shù)百個）。我首先把 ONNX 網(wǎng)絡(luò)的元數(shù)據(jù)輸出復(fù)制粘貼到 ChatGPT 中，并向助手闡述了我所知道的關(guān)于網(wǎng)絡(luò)的有限信息。ChatGPT 推測了輸入的組織方式，以及輸出可能是標準化后的框，用于指出圖像中潛在缺陷的部分，還有其他輸出表示這些缺陷的可能性。經(jīng)過幾分鐘的交流，我得到了一個能進行網(wǎng)絡(luò)推斷的 Python 腳本，以及將起始圖像轉(zhuǎn)換為適合輸入的張量等必要代碼。讓我印象深刻的是，當 ChatGPT 觀察到測試圖像上的原始輸出值（基本上是邏輯單元 (logits)）時，它終于“理解”了網(wǎng)絡(luò)的運作方式：一系列浮點數(shù)為識別輸出的確切細節(jié)和標準化提供了上下文，比如框是否居中或指定了左上角等細節(jié)。

一次性程序 ? 我曾經(jīng)遇到過很多類似的情況，就像我之前敘述的那樣。但記錄這些并沒有太大意義，因為這些情況重復(fù)的故事基本相同。我的問題是，我需要迅速了解一些事情，特別是在大語言模型給出的回答可能是無稽之談時，我得能夠驗證這些信息的真實性。在這種情況下，我會利用大語言模型加快我的知識獲取速度。但在其他情況下，我會讓大語言模型完全編寫代碼。舉個例子，當我需要編寫一個基本可以隨時丟棄的程序時。比如這個： 簡單語言模型示例程序 我需要可視化一個小型神經(jīng)網(wǎng)絡(luò)學習過程中的損失曲線（loss curve）。

我向 GPT4 展示了 PyTorch 程序在學習過程中生成的 CSV 文件格式，然后我提出了一個需求：如果我在命令行中指定了多個 CSV 文件，我不想再看到同一實驗的訓練和驗證損失曲線，而是想比較不同實驗的驗證損失曲線。上面就是 GPT4 生成的結(jié)果，總共用了三十秒。類似地，我需要一個程序來讀取 AirBnB 的 CSV 報告，并按月份和年份對我的公寓進行分組。接著，它會考慮清潔成本和每次預(yù)訂的夜晚數(shù)量，統(tǒng)計不同月份的平均租金價格。這個程序?qū)ξ曳浅Ｓ杏茫帉懰謽O其無聊，因為過程中沒有什么新穎之處。因此，我把 CSV 文件的一部分復(fù)制粘貼到 GPT4 上，告訴大語言模型我要解決的問題。程序第一次嘗試就運行成功了，下面是完整的展示。

import pandas as pd
pd.set_option('display.max_rows', None)
df = pd.read_csv('listings.csv')
reservations = df[df['Type'] == 'Reservation']
reservations['Start Date'] = pd.to_datetime(reservations['Start Date'])
reservations['Year'] = reservations['Start Date'].dt.year
reservations['Month'] = reservations['Start Date'].dt.month
reservations['Nightly Rate'] = (reservations['Amount'] - reservations['Cleaning Fee']) / reservations['Nights']
all_listings = reservations['Listing'].unique()
all_years = reservations['Year'].unique()
all_months = range(1, 13)
index = pd.MultiIndex.from_product([all_listings, all_years, all_months], names=['Listing', 'Year', 'Month'])
all_data = pd.DataFrame(index=index).reset_index()
merged_data = pd.merge(all_data, reservations, on=['Listing', 'Year', 'Month'], how='left')
average_nightly_rates = merged_data.groupby(['Listing', 'Year', 'Month'])['Nightly Rate'].mean().fillna(0)

要準確地理解如何對這些原本分散和無序的數(shù)據(jù)進行分組，需要一些簡單的邏輯推理。這不是大語言模型僅憑重復(fù)它所見過的語言模式就能簡單解決的問題。雖然 GPT4 在訓練中肯定觀察到了類似的程序，但幾乎可以肯定它沒有看到一個程序需要以我所要求的方式，在具有特定格式的 CSV 文件中對數(shù)據(jù)進行分組。這證明了（至少在我看來），大語言模型能夠在其訓練集中不同程序所勾勒的范圍內(nèi)進行一定程度的創(chuàng)新和推理。在我個人看來，編寫這類程序可能是對時間的不明智使用。一個大語言模型能替我完成這項工作，顯著提升了我編程的效率。這意味著，我能將精力集中在真正重要的事務(wù)上。

當事情不按計劃進行：系統(tǒng)編程的挑戰(zhàn) ? 在大語言模型和編程領(lǐng)域，我取得了一定的成功。但是，當我使用 C 語言編寫程序時，我通常只把 LLM 作為一種更便捷的文檔工具。作為一名系統(tǒng)編程專家，我發(fā)現(xiàn)只有在 LLM 能進行復(fù)雜的推理分析時，它們才對我有實際用處。而在這方面，LLM 經(jīng)常無法滿足期望。讓我們看一個實驗例子：試著概述一個高效、小型但完整的 C 語言實現(xiàn)的布隆過濾器（Bloom Filter）的要求，重點在于哈希（hashing）功能的關(guān)鍵要素。然后用優(yōu)質(zhì)的 C 語言編寫它。另外，考慮到你的例子應(yīng)該可以存儲 100,000 個元素，并且誤報概率不超過 5%。添加的元素是以空字符結(jié)尾的字符串。以下是輸出結(jié)果：

#include 
#include 
#include 
#include 


#define N 100000  // Number of elements
#define P 0.05    // False positive probability
#define M (int)(-(N * log(P)) / (log(2) * log(2)))  // Size of bit array
#define K (int)(M / N * log(2))  // Number of hash functions


unsigned char bitArray[M / 8 + 1];


void setBit(int n) {
    bitArray[n / 8] |= 1 << (n % 8);
}


int getBit(int n) {
    return bitArray[n / 8] & (1 << (n % 8));
}


// Basic hash functions (for demonstration purposes)
int hash1(char *str) {
    int hash = 5381;
    int c;
    while ((c = *str++))
        hash = ((hash << 5) + hash) + c;
    return abs(hash % M);
}


int hash2(char *str) {
    unsigned long hash = 0;
    int c;
    while ((c = *str++))
        hash = c + (hash << 6) + (hash << 16) - hash;
    return abs(hash % M);
}


void add(char *str) {
    setBit(hash1(str));
    setBit(hash2(str));
    // Add more hash functions if needed
}


int is_in(char *str) {
    return getBit(hash1(str)) && getBit(hash2(str));
    // Check more hash functions if used
}


int main() {
    char *testStr = "testString";
    add(testStr);


    if (is_in(testStr)) {
        printf("%s is probably in the set.
", testStr);
    } else {
        printf("%s is definitely not in the set.
", testStr);
    }


    return 0;
}

GPT4 所生成的布隆過濾器實現(xiàn)上并不算很出色。布隆過濾器應(yīng)用廣泛，并不是什么稀奇古怪的數(shù)據(jù)結(jié)構(gòu)。然而，要編寫一個合格的布隆過濾器，需要更高層次的抽象思維。比如，需要找到一種有效的方法，對同一個字符串進行多次哈希處理，同時確保這些哈希值相互之間的獨立性。但是，如果你明確指示 GPT4 改進哈希函數(shù)，使之能產(chǎn)生多個互不相關(guān)的輸出，它提出的方案就顯得更加合理： ?

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) + c + hash_id;
 }
 return hash % BF_SIZE;
}

? 如果 GPT4 能夠自行提出這種方案，它編寫的布隆過濾器將會有所不同，可能會使用單一的哈希函數(shù)一次性設(shè)置多個位。 GPT4 能夠獨立完成編寫合適且更通用哈希函數(shù)的任務(wù)。但在整個布隆過濾器的編寫過程中，它未能表現(xiàn)出足夠的推理能力。相反，它只是提供了兩種不同但相似的哈希函數(shù)，這種結(jié)果更像是從一篇關(guān)于布隆過濾器的低質(zhì)量文章中看到的。大語言模型在推理能力上的不足，加上可能缺乏高質(zhì)量的相關(guān)資料，甚至還可能存在大量低質(zhì)量的資料，共同造成了這種不盡人意的結(jié)果。

事實上，這并非個例。在算法或系統(tǒng)編程領(lǐng)域，我嘗試使用 LLM 的體驗通常都很差勁，哪怕在類似 Python 編程這樣的領(lǐng)域，LLM 表現(xiàn)出來的推理能力并不算高。與此同時，GPT-4 不僅能反編譯它生成的函數(shù)（在另一個獨立會話中），還能精準地理解該函數(shù)的用途： https://chat.openai.com/share/f54b64d7-d19a-4be4-8f10-08553aa812f1 因此，認為 GPT-4 在系統(tǒng)編程領(lǐng)域無用的說法顯然是不恰當?shù)摹?有趣的是，這些情況下，小型與大型模型之間的差異顯著。來看看兩個本地模型的對比表現(xiàn)。例如，Mistral 的專家模型 (MoE) Mixtral，對同樣的問題給出了以下回應(yīng)： ?

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) + c;
 }
 return hash + hash_id;
}

? 顯然，僅在最后加入 hash_id 是一個非常不佳的解決方案。Mixtral 對許多應(yīng)用而言是一個優(yōu)秀的模型，但對于大語言模型本就有限的推理能力來說，目前的規(guī)則顯然是：越大越好。這是我與本地大型語言模型 deepseek-coder 的對話記錄。由于 RAM 有限，我只能將模型量化到 4 位來使用。盡管如此，作為一個擁有 340 億參數(shù)的龐大模型，它在這個問題上的推理能力似乎相當出色。以下是我用 llama.cpp 進行的聊天記錄：

我有一個哈希函數(shù)，它應(yīng)該為相同的數(shù)據(jù)輸出 N 個不同的哈希。但是，我發(fā)現(xiàn)當我改變 hash_id 的值時，生成的哈希分布非常差：

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) + c;
 }
 return hash + hash_id;
}

? 可能是我使用的加鹽策略不夠好？我該如何改進呢？ [Deep-seek coder 的回復(fù)] 你的實現(xiàn)中可能存在的一個問題是，你只是簡單地在哈希的末尾添加了 hash_id。這可能會導(dǎo)致分布不均，尤其是當 hash_id 過大或分布不均時更為明顯。考慮使用位運算來混合 hash_id。這里有一個使用異或 (XOR) 運算的例子： ?

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) ^ c + hash_id; // Using XOR to mix in the hash_id
 }
 return (hash ^ hash_id); // Mixing the hash_id one more time at the end
}

這樣做可以比簡單添加更有效地分布 hash_id，從而使哈希分布更均勻。[省略……實際回復(fù)更詳盡] 在我的 MacBook M1 Max 上運行的這個模型表現(xiàn)得相當不錯。它成功地將求和和異或操作混合使用了。在這個案例中，模型得到了我提供的關(guān)于問題的線索的幫助，但最終是模型自己識別出了問題的真正所在，并提出了一個有效的解決方案。這樣的成就是任何書籍、文檔或 Google 搜索都無法達到的。不管你如何看待這個模型——無論是作為一個初級的、基于插值的結(jié)果，還是以其他方式——它確實展現(xiàn)了某種形式的推理能力。

在這個特定案例中，如果我們認為識別問題的根源和找到可能的解決方案是一種推理，那么它確實做到了這一點。但無論我們?nèi)绾慰创笳Z言模型，斷言它們對程序員無用是非常草率的。然而，根據(jù)我過去幾個月的經(jīng)驗，對于系統(tǒng)編程來說，如果你已是資深程序員，大語言模型往往無法提供令人滿意的解決方案。我來舉一個真實世界中的例子。我的最新項目，ggufflib，涉及到開發(fā)一個讀寫 GGUF 格式文件的庫，而這正是 llama.cpp 用來加載量化模型的格式。起初，為了弄懂量化編碼的工作原理（因為速度原因，每個量化比特都以特殊方式存儲），我試過使用 ChatGPT，但最后我選擇了對 llama.cpp 代碼進行逆向工程，這樣更加迅速。一個能夠有效協(xié)助系統(tǒng)程序員的大語言模型，在看到數(shù)據(jù)編碼的結(jié)構(gòu)聲明和解碼函數(shù)后，應(yīng)該能夠重建數(shù)據(jù)格式的文檔。雖然 llama.cpp 的功能足夠簡短，可以完全放入 GPT4 的上下文中，但它的輸出卻毫無用處。在這些情況下，我們還是得回歸傳統(tǒng)方式：紙筆在手，細讀代碼，尋找解碼器提取的比特在哪里注冊。為了讓你更好地理解上述案例，如果你感興趣，可以嘗試一下。這里有一個來自 llama.cpp 實現(xiàn)的結(jié)構(gòu)。 ?

// 6-bit quantization
// weight is represented as x = a * q
// 16 blocks of 16 elements each
// Effectively 6.5625 bits per weight
typedef struct {
 uint8_t ql[QK_K/2]; // quants, lower 4 bits
 uint8_t qh[QK_K/4]; // quants, upper 2 bits
 int8_t scales[QK_K/16]; // scales, quantized with 8 bits
 ggml_fp16_t d; // super-block scale
} block_q6_K;

? 然后是用于執(zhí)行去量化的函數(shù)： ?

void dequantize_row_q6_K(const block_q6_K * restrict x, float * restrict y, int k) {
 assert(k % QK_K == 0);
 const int nb = k / QK_K;
 for (int i = 0; i < nb; i++) {
 const float d = GGML_FP16_TO_FP32(x[i].d);
 const uint8_t * restrict ql = x[i].ql;
 const uint8_t * restrict qh = x[i].qh;
 const int8_t * restrict sc = x[i].scales;
 for (int n = 0; n < QK_K; n += 128) {
 for (int l = 0; l < 32; ++l) {
 int is = l/16;
 const int8_t q1 = (int8_t)((ql[l + 0] & 0xF) | (((qh[l] >> 0) & 3) << 4)) - 32;
 const int8_t q2 = (int8_t)((ql[l + 32] & 0xF) | (((qh[l] >> 2) & 3) << 4)) - 32;
 const int8_t q3 = (int8_t)((ql[l + 0] >> 4) | (((qh[l] >> 4) & 3) << 4)) - 32;
 const int8_t q4 = (int8_t)((ql[l + 32] >> 4) | (((qh[l] >> 6) & 3) << 4)) - 32;
 y[l + 0] = d * sc[is + 0] * q1;
 y[l + 32] = d * sc[is + 2] * q2;
 y[l + 64] = d * sc[is + 4] * q3;
 y[l + 96] = d * sc[is + 6] * q4;
 }
 y += 128;
 ql += 64;
 qh += 32;
 sc += 8;
 }
 }
}

? 當我請求 GPT4 編寫關(guān)于使用格式的概述時，它難以清晰地說明“ql”中上下四位的數(shù)據(jù)塊是如何存儲的，這與權(quán)重位置有關(guān)。在撰寫這篇博客時，我還嘗試讓它編寫一個簡化版本的函數(shù)來展示數(shù)據(jù)的存儲方式（可能它難以用文字解釋，但可以通過代碼來表達）。然而，它生成的函數(shù)存在諸多問題，比如索引不正確，從 6 位到 8 位的符號擴展處理錯誤（僅僅是將其轉(zhuǎn)換為 uint8_t 類型），等等。對了，這是我最終自己編寫的代碼： ?

} else if (tensor->type == GGUF_TYPE_Q6_K) {
 uint8_t *block = (uint8_t*)tensor->weights_data;
 uint64_t i = 0; // i-th weight to dequantize.
 while(i < tensor->num_weights) {
 float super_scale = from_half(*((uint16_t*)(block+128+64+16)));
 uint8_t *L = block;
 uint8_t *H = block+128;
 int8_t *scales = (int8_t*)block+128+64;
 for (int cluster = 0; cluster < 2; cluster++) {
 for (uint64_t j = 0; j < 128; j++) {
 f[i] = (super_scale * scales[j/16]) *
 ((int8_t)
 ((((L[j%64] >> (j/64*4)) & 0xF) |
 (((H[j%32] >> (j/32*2)) & 3) << 4)))-32);
 i++;
 if (i == tensor->num_weights) return f;
 }
 L += 64;
 H += 32;
 scales += 8;
 }
 block += 128+64+16+2; // Go to the next block.
 }
}

? 從上述函數(shù)中，我移除了這段代碼的核心貢獻：即長篇注釋，詳細記錄了 llama.cpp 中 Q6_K 編碼使用的確切格式?，F(xiàn)在，如果 GPT 能夠幫我完成這一工作，那將非常有幫助。我相信這只是時間問題，因為這類任務(wù)在沒有技術(shù)突破的情況下也是可行的，只需適當?shù)臄U展即可。

重新審視編程工作 ? 不得不說，這是一個事實：現(xiàn)今的編程大多是在微調(diào)同樣的內(nèi)容，只是形式略有變化。這種工作并不需要太高的推理能力。大語言模型在這方面表現(xiàn)出色，盡管它們的能力仍然受限于上下文長度。這個現(xiàn)象應(yīng)該引起程序員的深思：真的值得去編寫這類程序嗎？雖然可以賺到不錯的收入，但如果大語言模型也能完成其中一部分工作，那么在未來五到十年，這可能并非最佳的職業(yè)發(fā)展方向。再來看，大語言模型真的具備一定的推理能力，還是只是表面上的假象？有時候，它們似乎在進行推理，但這可能只是因為，像符號學家所說，使用的“符號”造成了一種實際上并不存在的意義錯覺。

足夠了解大語言模型的人會明白，事實并非如此：這些模型整合既有信息的能力，遠非簡單的詞匯重復(fù)。它們在預(yù)訓練期間的訓練主要是預(yù)測下一個 Token，這個過程迫使模型構(gòu)建了一種抽象的模型。雖然這個模型可能脆弱、零散且不完美，但從我們觀察到的現(xiàn)象來看，它確實存在。在數(shù)學確定性存在疑問，且領(lǐng)域內(nèi)頂尖專家意見分歧的情況下，相信自己的直覺似乎是明智之舉。

最后，今天還有什么理由不去使用大語言模型輔助編程呢？ 正確地向大語言模型提問是一項關(guān)鍵技能。這項技能練習得越少，利用 AI 改善工作的能力就越弱。而且，無論是與大語言模型還是與人類交流，清晰描述問題同樣重要。溝通不暢是一個嚴重的障礙，很多程序員盡管在自己的專業(yè)領(lǐng)域很有能力，但在溝通上卻做得很糟糕?，F(xiàn)在，連 Google 都變得不那么好用了，所以即便是將大語言模型作為一種壓縮文檔的方式來使用，也是個不錯的主意。至于我，我將繼續(xù)大量使用它們。我從來不喜歡去深究某個晦澀的通訊協(xié)議的細節(jié)，或者去理解由某些想要炫耀自己技術(shù)的人編寫的復(fù)雜庫方法。這些對我來說就像是"無用知識"。有了大語言模型，我就能免于這些困擾，每天都能感覺到它帶來的幫助。

審核編輯：黃飛

閱讀全文

神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)
機器學習(130423) 機器學習(130423)
Redis(10465) Redis(10465)
大模型(810) 大模型(810)

C語言-文件編程

這篇文章介紹C語言的文件編程函數(shù)，案例代碼是在Linux環(huán)境下運行測試的分別介紹了C語言標準庫的文件編程接口和Linux下的文件編程函數(shù)。

2022-09-09 11:33:30

1630

如何利用Transformers了解視覺語言模型

將模型稱為 “視覺語言” 模型是什么意思？一個結(jié)合了視覺和語言模態(tài)的模型？但這到底是什么意思呢？

2023-03-03 09:49:37

665

如何使用Rust連接Redis

Redis是一款快速、開源、鍵值存儲數(shù)據(jù)庫，被廣泛應(yīng)用于緩存、發(fā)布/訂閱系統(tǒng)、定時任務(wù)等場景中。Rust提供了很多Redis的客戶端庫，本教程將會介紹如何使用Rust連接Redis，以及如何通過

2023-09-19 16:22:28

1237

Redis Stream應(yīng)用案例

今天介紹的主角——Redis Stream，本身就是起源于IRC中一個用戶的idea。IRC的模型如下，在某個IRC頻道中的用戶，既可以向所有的其他用戶自由的發(fā)送消息，也可以接收其他所有用戶發(fā)送

2018-06-26 17:15:29

Redis主從復(fù)制的作用和步驟

Redis青銅修煉手冊（五） --- Redis的主從復(fù)制

2019-06-27 07:20:46

Redis使用總結(jié)

Spring+SpringMVC+MyBatis+easyUI整合進階篇（十四）Redis緩存正確的使用姿勢

2019-09-05 08:31:57

Redis基礎(chǔ)知識概述

Redis——基礎(chǔ)知識

2020-04-21 07:42:22

redis安裝與使用流程概述

Go語言第6天 - redis安裝與使用

2019-07-29 09:50:12

redis概述

REmote DIctionary Server（Redis）是一個基于key-value鍵值對的持久化數(shù)據(jù)庫存儲系統(tǒng)。redis和大名鼎鼎的Memcached緩存服務(wù)軟件很像，但是redis支持

2019-07-17 07:38:30

redis緩存注解怎么使用

spring boot —— redis 緩存注解使用教程

2019-09-11 14:43:48

C編程最佳實踐.doc

2012-08-17 14:37:18

C語言編程資料

VC.深入詳解.孫鑫(完整版)https://xbp.pub/i/GI33819c77BRT 龔建偉_Visual C++_Turbo C串口通信編程實踐.pdf...https://xbp.pub

2021-05-20 13:53:11

GPU編程的平臺模型、執(zhí)行模型、內(nèi)存模型及編程模型

GPU編程--OpenCL四大模型

2019-04-29 07:40:44

Python 之父退出Python 核心決策層，而轉(zhuǎn)居幕后

Python 會迎來更好的未來也不一定！......Python 之父如同大多數(shù)的編程語言之父一般，Guido van Rossum 也有著輝煌的履歷。1982 年，Guido van Rossum

2018-07-14 17:45:18

centos7 redis的安裝

centos7 redis 使用,查看Redis工具（安裝、添加權(quán)限驗證、添加開機自啟）

2019-05-14 17:13:40

labview讀寫操作REDIS

本帖最后由 SevenLi8408 于 2022-9-15 08:07 編輯分享一個好用的非關(guān)系型緩存數(shù)據(jù)庫的使用方法。REDIS桌面管理軟件https://github.com

2022-08-15 10:32:21

laravel使用redis

laravel操作redis筆記！

2019-09-24 09:40:58

linux的redis啟動方式

tar zxvf redis-2.8.9.tar.gzcd redis-2.8.9#直接make 編譯make#可使用root用戶執(zhí)行`make install`，將可執(zhí)行文件拷貝到/usr/local/bin目錄下。這樣就可以直接敲名字運行程序了。make install啟動

2019-07-17 08:03:13

linux的redis安裝啟動

1.將下載好的壓縮包放到/usr/local目錄下# tar x*** redis-3.0.2.tar.gz# cd redis-3.0.2# make提示錯誤 make: cc: Command not found make: *** [adlist.o] Error 127沒有安裝gcc環(huán)境，需要安裝gcc

2019-07-18 08:05:14

linux網(wǎng)絡(luò)編程實踐

linux網(wǎng)絡(luò)編程實踐-linux應(yīng)用編程和網(wǎng)絡(luò)編程第9部分互聯(lián)網(wǎng)課程品牌...

2021-12-23 06:38:29

《C++程序設(shè)計原理與實踐》(C++之父最新力作)

`《C++程序設(shè)計原理與實踐》(C++之父最新力作)`

2012-08-19 16:30:29

《RISC-V體系結(jié)構(gòu)編程與實踐》試讀

本書詳細地介紹了RISC-V的基本原理、指令集、編程工具和環(huán)境、體系結(jié)構(gòu)和擴展以及應(yīng)用案例和實踐等方面的內(nèi)容，覆蓋了RISC-V體系結(jié)構(gòu)的各個方面，使讀者能夠全面深入地了解RISC-V的體系結(jié)構(gòu)

2023-04-03 15:15:20

【書籍評測活動NO.30】大規(guī)模語言模型：從理論到實踐

更多的自然語言處理研究人員和對大語言模型感興趣的讀者能夠快速了解大模型的理論基礎(chǔ)，并開展大模型實踐，復(fù)旦大學張奇教授團隊結(jié)合他們在自然語言處理領(lǐng)域的研究經(jīng)驗，以及分布式系統(tǒng)和并行計算的教學經(jīng)驗，在

2024-03-11 15:16:39

【書籍評測活動NO.31】大語言模型：原理與工程實踐

深遠影響，尤其在優(yōu)化業(yè)務(wù)流程和重塑組織結(jié)構(gòu)方面。然而，在研究和實踐過程中，我們遇到了一個主要挑戰(zhàn)：市場上缺乏大語言模型在實際應(yīng)用方面的資料?，F(xiàn)有的資料多聚焦于理論研究，而具體的實踐方法多被保密，難以獲得

2024-03-18 15:49:46

使用Redis緩存model層

〈譯〉使用REDIS處理RAILS MODEL緩存

2019-04-18 17:07:18

單片機C語言編程基礎(chǔ)與實踐

2012-08-20 23:18:29

啟動Redis的三種方法

Redis筆記（1）——安裝、卸載、三種方法啟動Redis，Redis命令使用（干貨十足），Redis兩種方法設(shè)置密碼，時間復(fù)雜度（更完善哦~）

2020-06-08 16:09:26

如何使得redis中的數(shù)據(jù)不再有

嵌入式Linux系統(tǒng)重啟后如何使得redis中的數(shù)據(jù)不再有今天在工作中遇到一個問題：網(wǎng)頁展示redis中的數(shù)據(jù)，然而再Linux系統(tǒng)重啟后網(wǎng)頁還能展示redis中的數(shù)據(jù)，感覺很奇怪，到網(wǎng)上搜了下

2021-11-05 08:50:53

并行編程模型有什么優(yōu)勢

并行編程模型是并行計算，尤其是并行軟件的基礎(chǔ)，也是并行硬件系統(tǒng)的導(dǎo)向，在面臨多核新挑戰(zhàn)的情況下，什么樣的并行編程模型在未來能成為主流，還很難說。至少到目前，還處于百家爭鳴的時代，很多模型提出，很多在應(yīng)用，下面我們簡單介紹一下當前的并行編程模型現(xiàn)狀。

2019-07-11 08:03:33

求單片機C語言編程圖書

誰推薦一下比較好的單片機C語言編程圖書對C語言在單片機編程介紹比較全面的實踐性比較強的告訴我書名和作者就好謝謝

2011-10-06 10:28:29

自然語言處理的語言模型

自然語言處理——53 語言模型（數(shù)據(jù)平滑）

2020-04-16 11:11:25

請問如何分析、排查、解決Redis變慢問題

如何分析、排查、解決Redis變慢問題

2020-11-09 08:03:41

C語言編程寶典之一

2006-04-08 01:59:31

高職高?！禞ava 語言程序設(shè)計》教學與實踐

高職高?！禞ava 語言程序設(shè)計》教學與實踐摘要:《java 語言程序設(shè)計》是高職高專院校計算機專業(yè)的一門重要專業(yè)基礎(chǔ)課, 面向?qū)ο?b class="flag-6" style="color: red">編程是目前流行的一種編程

2010-04-23 10:57:53

C語言編程技巧

電子發(fā)燒友為您提供了 C語言編程技巧，幫助您解決編程的困擾。

2011-06-23 14:53:00

601

Redis原理篇-23.Redis網(wǎng)絡(luò)模型-epoll的ET

Redis

電子學習發(fā)布于 2023-01-06 21:23:52

Redis原理篇-26.Redis網(wǎng)絡(luò)模型-Redis是單線

Redis

電子學習發(fā)布于 2023-01-06 21:53:51

Redis原理篇-17.Redis網(wǎng)絡(luò)模型-阻塞IO

Redis

電子學習發(fā)布于 2023-01-06 21:59:57

Redis高級篇-01.Redis最佳實踐課程介紹

Redis

電子學習發(fā)布于 2023-01-06 22:10:14

javascript語言精髓與編程實踐(第二章)介紹

javascript語言精髓與編程實踐(第二章)

2015-10-30 10:07:22

javascript語言精髓與編程實踐(第一章)介紹

javascript語言精髓與編程實踐(第一章)

2015-10-30 10:07:43

STM8的C語言編程說明

STM8的C語言編程說明STM8的C語言編程說明STM8的C語言編程說明STM8的C語言編程說明

2015-12-10 16:19:59

單片機高級語言編程與_uVision2應(yīng)用實踐

Keil Cx51 V7_0單片機高級語言編程與_uVision2應(yīng)用實踐

2016-01-12 15:53:59

C語言入門經(jīng)典-C語言編程

C語言入門經(jīng)典-C語言編程，感興趣的可以看看哦。

2016-08-16 18:54:45

111

php session使用redis如何設(shè)置密碼

Redis是一個開源的使用ANSI C語言編寫、支持網(wǎng)絡(luò)、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫，并提供多種語言的API。redis是一個key-value存儲系統(tǒng)。和Memcached類似，它支持存儲的value類型相對更多。

2017-11-16 15:38:40

2184

redis應(yīng)用場景及實例

本文主要闡述了redis應(yīng)用場景及實例。Redis是一個開源的使用ANSI C語言編寫、支持網(wǎng)絡(luò)、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫，并提供多種語言的API。在這篇文章中，我們將闡述 Redis 最常用的使用場景，以及那些影響我們選擇的不同特性。

2018-02-09 15:01:13

6772

vb語言編程學習怎么入門

要想成為一名優(yōu)秀的程序員，最重要的是掌握編程思想、找到編程感覺，而不是死記硬背語言本身。所以，從某種角度上講，很多語言是一致的。學會了C++，JAVA也能夠很快上手。我們面對新的編程語言時，只需簡單

2018-03-12 16:35:40

70120

函數(shù)式編程語言、編程和程序驗證

是1930年代在調(diào)查函數(shù)定義、函數(shù)應(yīng)用和遞歸時研發(fā)的一個形式系統(tǒng)，是等價于圖靈機的一種抽象的計算模型，許多函數(shù)式編程語言都可看成是在?演算基礎(chǔ)上精心制作出的結(jié)果

2018-04-03 11:01:40

關(guān)于Redis的相關(guān)問題與Memcached的對比

庫，也沒有編譯參數(shù)必需添加。redis的安裝出奇的簡單，這可能也是他風靡的一個原因，讓人很容易上手.Redis 是一個使用 C 語言寫成的，開源的 key-value 數(shù)據(jù)庫。。

2018-04-23 16:19:00

1669

Redis為什么這么快！深入了解Redis的內(nèi)存模型！

Redis是目前最火爆的內(nèi)存數(shù)據(jù)庫之一，通過在內(nèi)存中讀寫數(shù)據(jù)，大大提高了讀寫速度，可以說Redis是實現(xiàn)網(wǎng)站高并發(fā)不可或缺的一部分。

2018-05-02 16:57:54

4215

LabVIEW之父歷史回顧編程理念，這將對未來造成怎樣的影響

LabVIEW之父Jeff Kodosky回顧了他如何創(chuàng)造圖形化編程，并且分享了基本的編程理念。這些理念可以應(yīng)對高要求應(yīng)用的挑戰(zhàn)，對未來25年圖形化系統(tǒng)設(shè)計至關(guān)重要。

2018-06-22 03:34:00

4161

10個Java編程中異常處理最佳實踐

這里是我收集的10個Java編程中進行異常處理的10最佳實踐。在Java編程中對于檢查異常有褒有貶，強制處理異常是一門語言的功能。在本文中，我們將盡量減少使用檢查型異常，同時學會在Java編程中使用檢查型VS非檢查型異常。

2020-05-03 17:49:00

1739

PLC編程的語言種類及特點

PLC編程語言主要由兩大類：一是采用字符表達方式的編程語言，二是采用圖形符號表達方式的編程語言。

2020-05-03 17:43:00

3583

40年后C++為何仍然當今使用最廣泛的編程語言之一？

強大、靈活、復(fù)雜：C++ 的起源可以追溯到 40 年前，但它仍然是當今使用最廣泛的編程語言之一。為了找出原因，TechRepublic 采訪了 C++ 之父 Bjarne Stroustrup

2021-02-15 11:18:00

2512

Visual C串口通信技術(shù)與編程實踐

Visual C串口通信技術(shù)與編程實踐說明。

2021-03-23 09:43:02

7個維度和43條使用規(guī)范，聊一聊Redis的最佳實踐

這篇文章我想和你聊一聊 Redis 的最佳實踐。你的項目或許已經(jīng)使用 Redis 很長時間了，但在使用過程中，你可能還會或多或少地遇到以下問題：我的 Redis 內(nèi)存為什么增長這么

2021-03-30 10:40:07

1461

全面分析Redis的最佳實踐優(yōu)化

2021-04-26 10:51:53

1569

JAVA并發(fā)編程實踐

JAVA并發(fā)編程實踐資料免費下載。

2021-06-01 15:31:55

Verilog是編程語言嗎

知乎上刷到一個問題，問性能最強的編程語言是什么？看到高贊回答到是Verilog，然后在評論區(qū)就引發(fā)了一場Verilog到底算不算編程語言的爭論，我覺得比較有意思，所以就也打算嘮嘮這個事情。趁著最近

2021-08-23 14:30:49

5560

C語言程序實踐--ACM入門

C語言程序實踐--ACM入門(開關(guān)電源技術(shù)發(fā)展綜述)-該文檔為C語言程序實踐--ACM入門講解文檔，是一份不錯的參考資料，感興趣的可以下載看看，，，，，，，，，，，，，，，，，

2021-09-22 17:42:31

單片機c語言+編程c語言_C編程語言簡介

單片機c語言+編程c語言In this tutorial you will get basic introduction to C programming language. 在本教程中，您將獲得

2021-11-29 10:21:14

響應(yīng)式編程在Android開發(fā)中的實踐

Flow 是一種基于流的編程模型，本文我們將向大家介紹響應(yīng)式編程以及其在 Android 開發(fā)中的實踐，您將了解到如何將生命周期、旋轉(zhuǎn)及切換到后臺等狀態(tài)綁定到 Flow 中，并且測試它們是否能按照預(yù)期執(zhí)行。

2022-04-02 14:07:14

1422

Redis基礎(chǔ)架構(gòu)設(shè)計及核心網(wǎng)絡(luò)模型架構(gòu)演進

性能優(yōu)異的服務(wù)離不開好的架構(gòu)設(shè)計，Redis使用 I/O multiplexing 實現(xiàn)了單線程接收海量客戶端請求；通過單線程Reactor模型實現(xiàn)了高性能的事件處理

2022-10-11 15:08:05

305

ST語言編程手冊

介紹ST語言編程與使用

2022-10-24 14:36:05

手擼了個Redis分布式鎖

實現(xiàn)分布式鎖的方式有很多，其中 Redis 是最常見的一種。而相較于 Java + Redis 的方案，我個人更傾向于 Go+Redis，從編程難易程度上來說，要簡單得多。

2022-11-03 14:44:22

440

以Python編程語言為例介紹編程語言

編程語言是研發(fā)人員與計算機交流的工具，計算機中的程序和軟件均通過編程語言編寫。

2023-02-09 10:11:22

946

深入探究Redis存儲原理

**Redis是用C語言開發(fā)的一個開源的高性能鍵值對（key-value）內(nèi)存數(shù)據(jù)庫。** **Redis數(shù)據(jù)存儲原理**

2023-02-15 15:52:38

484

Redis實現(xiàn)限流的三種方式分享

當然，限流有許多種實現(xiàn)的方式，Redis具有很強大的功能，我用Redis實踐了三種的實現(xiàn)方式，可以較為簡單的實現(xiàn)其方式。

2023-02-22 09:52:10

599

探究Redis網(wǎng)絡(luò)模型究竟有多強大（上）

本文將從BIO開始介紹，經(jīng)過NIO、多路復(fù)用，最終說回Redis的Reactor模型，力求詳盡。本文與其他文章的不同點主要在于：

2023-03-03 09:46:02

276

PLC編程語言的國際標準和C語言的區(qū)別

　　PLC編程語言是工業(yè)控制領(lǐng)域內(nèi)用于編寫PLC程序的語言，旨在實現(xiàn)對工業(yè)設(shè)備和生產(chǎn)流程的自動化控制和監(jiān)測。PLC編程語言包含多種語言類型，如圖形化編程語言、文本化編程語言、結(jié)構(gòu)化編程語言等，可根據(jù)不同應(yīng)用場景和編程需求進行選擇和組合。C語言是一種通用計算機編程語言。以下是它們之間的主要區(qū)別：

2023-03-17 17:13:28

3901

西門子PLC編程語言介紹

PLC目前有5種標準的編程語言，包括圖形化編程語言和文本化編程語言。

2023-04-15 14:13:12

1214

PLC各種編程語言特點

編程語言種類很多，各有各的優(yōu)勢，語句表和指令表類似，是編程語言的一種，在PLC中應(yīng)用比較普遍，也是一種高級編程語言，PLC中語句表、梯形圖、SCL等編程語言的特點：

2023-04-20 09:55:44

什么是 Redis

? — ? 1 ?— 什么是 Redis？ Redis（REmote DIctionary Service）是一個開源的鍵值對數(shù)據(jù)庫服務(wù)器。 Redis 更準確的描述是一個數(shù)據(jù)結(jié)構(gòu)服務(wù)器。Redis

2023-05-22 15:32:57

564

Redis的主從、哨兵、Redis Cluster集群

? 前言今天跟小伙伴們一起學習Redis的主從、哨兵、Redis Cluster集群。 Redis主從 Redis哨兵 Redis Cluster集群基于 Spring Boot

2023-06-12 14:58:19

443

基于PASCAL的高級編程語言——SCL編程語言

根據(jù)該標準，可對用于可編程邏輯控制器的編程語言進行標準化。SCL 編程語言實現(xiàn)了該標準中定義的 ST 語言 (結(jié)構(gòu)化文本) 的 PLCopen 初級水平。

2023-06-20 10:20:45

956

西門子PLC編程語言介紹

PLC目前有5種標準的編程語言，包括圖形化編程語言和文本化編程語言。

2023-06-29 16:00:29

825

PLC編程語言的特點

PLC的編程語言與一般計算機語言相比，具有明顯的特點，它既不同于高級語言，也不同與一般的匯編語言，它既要滿足易于編寫，又要滿足易于調(diào)試的要求。目前，還沒有一種對各廠家產(chǎn)品都能兼容的編程語言。如三菱

2023-07-04 17:13:42

514

機器學習構(gòu)建ML模型實踐

實踐中的機器學習：構(gòu)建 ML 模型

2023-07-05 16:30:36

412

語言模型的發(fā)展歷程基于神經(jīng)網(wǎng)絡(luò)的語言模型解析

簡單來說，語言模型能夠以某種方式生成文本。它的應(yīng)用十分廣泛，例如，可以用語言模型進行情感分析、標記有害內(nèi)容、回答問題、概述文檔等等。但理論上，語言模型的潛力遠超以上常見任務(wù)。

2023-07-14 11:45:40

454

TypeScript之父也搞大模型：推出TypeChat

C# 和 TypeScript 之父 Anders Hejlsberg 今天宣布了全新的開源項目 ——TypeChat，它通過 AI 在自然語言和應(yīng)用程序模式 (application schema)，以及 API 之間構(gòu)建了一座 “橋梁”，能用新穎有趣的方式使用 TypeScript。

2023-07-24 09:27:06

541

中譯語通展示格物多語言大模型技術(shù)和工業(yè)實踐

大模型技術(shù)和工業(yè)實踐。會議還匯聚了騰訊AI Lab、百度等科技企業(yè),學術(shù)界和工業(yè)界的研究學者與從業(yè)人員,分享各自研究成果和實踐經(jīng)驗,推動了大模型和自然語言生成領(lǐng)域的技術(shù)創(chuàng)新與研究成果轉(zhuǎn)化。中譯語通作為NLGIW戰(zhàn)略合作伙伴參會展示本屆會議組織單位為中國中文

2023-07-27 09:44:38

365

五種支持plc編程的語言有哪些

在PLC控制系統(tǒng)設(shè)計中，不同型號的PLC編程軟件對以上五種編程語言的支持種類是不同的，所以不但對PLC的硬件性能了解外，也要了解PLC對編程語言支持的種類。

2023-08-31 14:54:15

634

騰訊發(fā)布混元大語言模型

騰訊發(fā)布混元大語言模型騰訊全球數(shù)字生態(tài)大會上騰訊正式發(fā)布了混元大語言模型，參數(shù)規(guī)模超千億，預(yù)訓練語料超2萬億tokens。作為騰訊自研的通用大語言模型，混元大語言模型具有中文創(chuàng)作能力、任務(wù)執(zhí)行

2023-09-07 10:23:54

815

虹科分享 | 谷歌Vertex AI平臺使用Redis搭建大語言模型

基礎(chǔ)模型和高性能數(shù)據(jù)層這兩個基本組件始終是創(chuàng)建高效、可擴展語言模型應(yīng)用的關(guān)鍵，利用Redis搭建大語言模型，能夠?qū)崿F(xiàn)高效可擴展的語義搜索、檢索增強生成、LLM 緩存機制、LLM記憶和持久

2023-09-18 11:26:49

316

如何用Springboot整合Redis

本篇文件我們來介紹如何用Springboot整合Redis。 1、Docker 安裝 Redis 1.1 下載鏡像 docker pull redis: 6 . 2 . 6 1.2 創(chuàng)建配置文件

2023-10-08 14:56:52

293

怎樣使用FHE實現(xiàn)加密大語言模型？

近來，大語言模型 (LLM) 已被證明是提高編程、內(nèi)容生成、文本分析、網(wǎng)絡(luò)搜索及遠程學習等諸多領(lǐng)域生產(chǎn)力的可靠工具。

2023-10-19 09:13:57

410

redis與mysql的區(qū)別

Redis與MySQL是兩種常見的數(shù)據(jù)庫管理系統(tǒng)，兩者在很多方面存在差異，本文將詳細分析Redis與MySQL的區(qū)別。數(shù)據(jù)模型： Redis是一種基于鍵值對的NoSQL數(shù)據(jù)庫，它將數(shù)據(jù)存儲為鍵值

2023-11-16 11:21:11

398

腳本語言和編程語言的區(qū)別

腳本語言和編程語言是計算機語言的兩個主要分類。盡管兩者都是用于編寫計算機程序的工具，但它們在設(shè)計和運行方式上存在一些顯著的區(qū)別。下面將詳細探討腳本語言和編程語言之間的區(qū)別。定義：腳本語言

2023-11-22 14:33:14

1070

Java redis鎖怎么實現(xiàn)

在Java中實現(xiàn)Redis鎖涉及到以下幾個方面：Redis的安裝配置、Redis連接池的使用、Redis數(shù)據(jù)結(jié)構(gòu)的選擇、實現(xiàn)分布式鎖的幾種方式等。一、Redis的安裝配置下載Redis并解壓縮

2023-12-04 10:47:57

295

java redis鎖處理并發(fā)代碼

在并發(fā)編程中，一個常見的問題是如何確保多個線程安全地訪問共享資源，避免產(chǎn)生競態(tài)條件和數(shù)據(jù)異常。而Redis作為一種高性能的內(nèi)存數(shù)據(jù)庫，可以提供分布式鎖的功能，通過Redis鎖，我們可以有效地解決并發(fā)

2023-12-04 11:04:24

239

redis連接數(shù)配置多少合適

Redis 是一款高性能的內(nèi)存數(shù)據(jù)庫，廣泛應(yīng)用于緩存、消息隊列、會話存儲等場景。在配置 Redis 連接數(shù)時，需要根據(jù)實際情況綜合考慮一系列因素，如服務(wù)器硬件規(guī)格、業(yè)務(wù)負載、并發(fā)訪問量、數(shù)據(jù)模型

2023-12-04 11:31:58

357

大語言模型簡介：基于大語言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶：Bedrock對大語言模型進行介紹。大語言模型指的是具有數(shù)十億參數(shù)（B+）的預(yù)訓練語言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語言處理任務(wù)，如文本生成、機器翻譯和自然語言理解等。

2023-12-04 15:51:46

356

redis容器部署并用編程演示sb整合

Redis，并通過編程演示 Spring Boot 如何整合 Redis。 Redis 容器部署 Redis 可以通過容器部署，我們可以使用 Docker 來創(chuàng)建 Redis 容器。以下是在 Docker

2023-12-05 10:08:42

173

redis容器內(nèi)怎么查看redis日志

redis是一款流行的開源內(nèi)存數(shù)據(jù)庫，常用于緩存、消息隊列、任務(wù)管理等場景。在使用redis時，了解如何查看redis日志對于排查問題、監(jiān)控性能和分析應(yīng)用程序行為非常重要。在本文中，我們將介紹

2023-12-05 10:10:24

1010

redis是關(guān)系型數(shù)據(jù)庫嗎

Server）是一個開源的高性能鍵值對存儲系統(tǒng)。它使用C語言編寫，具有內(nèi)存中數(shù)據(jù)存儲和持久化到硬盤的功能。Redis支持多種數(shù)據(jù)結(jié)構(gòu)，如字符串、哈希表、列表、集合和有序集合等，這使得它可以應(yīng)對各種類型的應(yīng)用需求。 Redis的特點之一是高性能。由于數(shù)據(jù)存儲在內(nèi)存中，Redis可以快速讀寫

2023-12-05 10:32:51

458

redis高并發(fā)能力直接相關(guān)概念有哪些

請求和響應(yīng)，這意味著它可以同時處理多個客戶端請求，而不需要等待每個請求的完成。這種機制是通過使用事件驅(qū)動的編程模型和底層的網(wǎng)絡(luò)庫來實現(xiàn)的。非阻塞IO可以大大提高Redis的并發(fā)能力。多線程：Redis支持多線程來處理客戶端請求。當一個客戶端請求到達

2023-12-05 10:34:31

181