0

Mike Petrucci 發布在 Unsplash 雜志上的照片
在這篇文章中,我們將看到 2019 年在 MyBridge 上最受歡迎的頂級開源機器學習項目。
實時語音克隆(13.7K??)
這個項目是 SV2TTS 論文的一個實現,它是一個能夠實時工作的聲碼器。使用此 repo,用戶可以在 5 秒內克隆語音,實時生成任意談話。

網址:https://arxiv.org/abs/1806.04558
SV2TTS 的三階段深度學習框架允許從幾秒鐘的音頻中創建語音的數字表示。

網址:https://github.com/CorentinJ/Real-Time-Voice-Cloning
UGATIT:具有自適應層實例規范化的無監督生成注意網絡(4.4K??)
這是 U-GAT-IT 的 TensorFlow 實現。本文提出了一種無監督圖像到圖像轉換的實現方法,該方法增加了一個新的注意模塊和一個新的可學習的端到端的歸一化函數。


網址:https://arxiv.org/abs/1907.10830
注意力模塊引導模型關注更重要的區域,從而基于輔助分類器獲得的注意力圖來區分源域和目標域。AdaLIN(自適應層實例歸一化)函數幫助模型通過學習的參數控制圖像中形狀和紋理的變化量。

網址:https://github.com/taki0112/UGATIT
RAdam:自適應學習速率的方差及其超越(1.9K??)
這是以下論文的一個實現:

網址:https://arxiv.org/abs/1908.03265
作者提出了 Adam 的變體 RAdam。這是通過校正自適應學習過程的方差來實現的。作者使用圖像分類、語言建模和神經機器翻譯任務來獲得實驗結果。

網址:https://github.com/LiyuanLucasLiu/RAdam
深度學習推薦模型 Dlrm 的實現(1.7K??)
這是一個最先進的深度學習推薦模型——DLRM,它可以在 PyTorch 和 Caffe2 中實現。

網址:https://arxiv.org/abs/1906.00091
該模型有一個專門的并行化方案,該方案利用嵌入表上的模型并行性來遷移內存約束。這使得數據并行性的開發能夠從完全連接的層擴展計算。

網址:https://github.com/facebookresearch/dlrm
TecoGAN(1.3K??)
此 repo 包含用于 TEmporally COherent GAN 的代碼。

網址:https://github.com/thunil/TecoGAN

視頻網址:https://youtu.be/pZXFXtfd-Ak
這篇論文提出了一種對抗性訓練視頻超分辨率方案,該方案在不犧牲空間細節的前提下,實現了時間相干解。它還提出了一種 Ping-Pong 損失,可以在不降低感知質量的情況下消除遞歸網絡中的時間偽影。

網址:https://arxiv.org/abs/1811.09393
Megatron-LM(1.1K??)
Megatron repo 是一個正在進行的研究項目,旨在大規模訓練大型、功能強大的 transformer 語言模型。它目前支持 GPT2 和 BERT 的模型并行、多節點訓練。

網址:https://github.com/NVIDIA/Megatron-LM
它目前能夠訓練具有 72 個層,83 億個參數的 GPT2 語言模型,具有 8 路模型和 64 路數據并行性,它們分布在 512 個 GPU 上。它可以在 3 天內訓練多達 64 V100 gpu 的 BERT。Megatron 語言模型的困惑度為 3.15,F1 評分為 90.7。
TensorNetwork(1K??)
TensorNetwork 是一個用于實現 tensor 網絡算法的開源庫。它是 TensorFlow、JAX、PyTorch 和 NumPy 的 tensor 網絡包裝器。

網址:https://github.com/google/tensornetwork
張量網絡是目前應用于機器學習研究的稀疏數據結構。目前,開發人員并不提倡在生產環境中使用該工具。

網址:https://arxiv.org/abs/1906.06329
Python_autocomplete(708?65039;)
這是一個基于 TensorFlow 項目,它的目的是測試 LSTM 自動完成 Python 代碼的能力。

網址:https://github.com/vpj/python_autocomplete
Buffalo (365 ??)
Buffalo 是一個快速、可擴展、面向實際生產的推薦系統開源項目。它有效地利用了系統資源,從而在低規格的機器上實現了高性能。

網址:https://github.com/kakao/buffalo
真實的神經說話頭部模型(312??)
這是「Few-Shot Adversarial Learning of Realistic Neural Talking Head Models」一文的實現。這篇論文提出了一種個性化的、逼真的說話頭部模型,其目的是在給定一組人臉標志的情況下合成具有真實感的個性化面部圖像。

網址:https://arxiv.org/abs/1905.08233
這個方法適用于遠程呈現、視頻會議、特效行業和多人游戲,它所提出的系統能夠以特定的方式初始化生成器和判別器的參數,這使得訓練過程中圖像能被快速地使用。

網址:https://github.com/vincent-thevenin/Realistic-Neural-Talking-Head-Models
展望未來
展望 2020 年,隨著機器學習工具變得更先進、更具易用性,我們肯定會遇到更多有趣的開源項目,敬請期待。
via:https://heartbeat.fritz.ai/2019s-top-open-source-machine-learning-projects-3cd082a02f78
雷鋒網雷鋒網雷鋒網
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。