
微軟和英偉達(dá)今天宣布了由DeepSpeed和Megatron驅(qū)動的Megatron-Turing自然語言生成模型(MT-NLG),這是迄今為止訓(xùn)練的最大和最強大的解碼語言模型。這個模型包括5300億個參數(shù),與現(xiàn)有最大的模型GPT-3相比,參數(shù)數(shù)量是其3倍。
訓(xùn)練這樣的大型模型涉及各種挑戰(zhàn),沿著所有的人工智能軸線進(jìn)行了許多創(chuàng)新和突破。例如,通過緊密合作,英偉達(dá)和微軟將最先進(jìn)的GPU加速訓(xùn)練基礎(chǔ)設(shè)施與尖端的分布式學(xué)習(xí)軟件堆棧相融合,實現(xiàn)了前所未有的訓(xùn)練效率。
微軟與NVIDIA建立了高質(zhì)量的自然語言訓(xùn)練語料庫,其中包含數(shù)千億個標(biāo)記,并共同開發(fā)了訓(xùn)練配方,以提高優(yōu)化效率和穩(wěn)定性。
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 www.hngelin.com All Rights Reserved.
中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
五大连池市| 红河县| 司法| 扶沟县| 饶阳县| 阳城县| 东丽区| 佳木斯市| 方城县| 临西县| 高密市| 上饶市| 定结县| 和林格尔县| 凤庆县| 油尖旺区| 东至县| 阿城市| 泽库县| 北川| 威远县| 芒康县| 安岳县| 汝阳县| 台湾省| 本溪| 广东省| 行唐县| 黎川县| 内黄县| 南川市| 宁化县| 临漳县| 基隆市| 渝北区| 沭阳县| 宁明县| 靖边县| 苏尼特右旗| 根河市| 鄱阳县|