开源机器学习与数据科学全家桶
本帖精选Python机器学习与数据科学核心工具,涵盖深度学习框架、传统ML、数据处理等,是AI工程师和数据科学家的必备工具集。
- pytorch/pytorch — 86K★ | C++ | Meta深度学习框架,动态计算图/autograd自动微分/torch.nn模块,Python优先,HuggingFace核心后端
- tensorflow/tensorflow — 183K★ | C++ | Google深度学习框架,Keras高层API/TF2 Eager Mode/TFX生产流水线,TensorBoard可视化
- google/jax — 28K★ | Python | Google自动微分库,Autograd+XLA编译/JIT高性能/vmap向量化/pmap并行,PyTorch竞争者
- keras-team/keras — 60K★ | Python | 高层深度学习API,Sequential/Functional/Subclassing模型,TF/PyTorch/JAX三后端,预训练Hub
- scikit-learn/scikit-learn — 58K★ | Python | 传统机器学习标准库,SVM/随机森林/KMeans/PCA/Pipeline,sklearn.model_selection
- xgboost/xgboost — 25K★ | C++ | 梯度提升框架,分类/回归/排序,GPU加速/分布式/DART,Kaggle竞赛必备
- catboost/catboost — 18K★ | C++ | Yandex梯度提升,Category特征原生支持/ordered boosting,GPU训练
- lightgbm/lightgbm — 17K★ | C++ | 微软轻量级梯度提升,叶方向增长/GOSS样本抽样,直方图算法,高速低内存
核心功能
• PyTorch: torch.tensor/autograd,nn.Module/Layer,torch.optim优化器,torch.utils.data.DataLoader
• TensorFlow: tf.keras.Sequential/compile/fit,tf.data.Dataset,TensorBoard,SavedModel导出
• JAX: jax.grad/jax.jit,jax.numpy,pmap/vmap向量化并行,flax/equinox神经网络库
• sklearn: SVC/KMeans/PCA,Pipeline.fit/predict,GridSearchCV超参搜索,cross_val_score
适用场景
• 深度学习模型训练
• 机器学习建模
• 数据预处理
• Kaggle竞赛
• 模型部署推理
游客,本帖隐藏的内容需要积分高于 20 才可浏览,您当前积分为 0 |