基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练,GPU支持CUDA,CUDNN
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现训练或测试模型,支持多GPU训练。框架目前支持BP神经网络、卷积神经网络、循环神经网络、vgg16、resnet、yolo、lstm、transformer、gpt、llama、diffusion、stable diffusion等模型的构建,目前引擎最新版本支持CUDA和CUDNN两种GPU加速方式,关于GPU加速的环境配置与jcuda版本jar包的对应依赖,引擎中所实现的模型和算法除了使用cuda和cudnn相关依赖包之外均不使用任何api和第三方依赖包。
依赖由于engine-v4-gpu加入了jcuda支持,所以engine-v4-gpu需要安装与jcuda版本对应的cuda,如果您的机器安装的CUDA版本是11.7.x,那么对应engine需要引入的jcuda 11.7.0版本。 快速开始1.检查当前CUDA版本
2.安装CUDA与CUDNNhttps://developer.nvidia.com/cuda-toolkit-archive 3.引入或下载与当前CUDA版本对应的omega-engine包
win-cu-x.x 版本包列表
- <dependency>
- <groupId>io.gitee.iangellove</groupId>
- <artifactId>omega-engine-v4-gpu</artifactId>
- <version>win-cu11.7-v1.0-beta</version>
- </dependency>
复制代码 4.初始化GPU环境与释放显存- public static void main(String[] args) {
- try {
- //初始化GPU环境获取Context对象
- CUDAModules.initContext();
- CNNTest cnn = new CNNTest();
- cnn.cnnNetwork_cifar10();
- } finally {
- //释放所有显存
- CUDAMemoryManager.free();
- }
- }
复制代码 系统参数由于训练vgg16模型的参数比较庞大,所以在部署项目的时候需要对jvm内存进行调整. 调整事例如:-Xmx20480m -Xms20480m -Xmn10240m Demo展示
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
yolo目标识别算法系列
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于yolov3口罩佩戴识别
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于yolov3安全帽佩戴识别
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于yolov7智能冰柜商品识别
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
GAN对抗生成神经网络系列
基于GAN生成对抗神经网络实现生成手写体数字图片
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于DCGAN生成对抗神经网络实现生成动漫头像图片
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
时序模型系列
基于RNN循环神经网络实现小说生成器
斗破苍穹前50章原文
- 月如银盘,漫天繁星。山崖之颠,萧炎斜躺在草地之上,嘴中叼中一根青草,微微嚼动,任由那淡淡的苦涩在嘴中弥漫开来举起有些白皙的手掌,挡在眼前,目光透过手指缝隙,遥望着天空上那轮巨大的银月。唉想起下午的测试,萧炎轻叹了一口气,懒懒的抽回手掌,双手枕着脑袋,眼神有些恍惚十五年了呢低低的自喃声,忽然毫无边际的从少年嘴中轻吐了出来。在萧炎的心中,有一个仅有他自己知道的秘密:他并不是这个世界的人,或者说,萧炎的灵魂,并不属于这个世界,他来自一个名叫地球的蔚蓝星球,至于为什么会来到这里,这种离奇经过,他也无法解释,不过在生活了一段时间之后,他还是后知后觉的明白了过来:他穿越了!随着年龄的增长,对这块大陆,萧炎也是有了些模糊的了解大陆名为斗气大陆,大陆上并没有小说中常见的各系魔法,而斗气,才是大陆的唯一主调!在这片大陆上,斗气的修炼,几乎已经在无数代人的努力之下,发展到了巅峰地步,而且由于斗气的不断繁衍,最后甚至扩散到了民间之中,这也导致,斗气,与人类的日常生活,变得息息相关,如此,斗气在大陆中的重要性,更是变得无可替代!因为斗气的极端繁衍,同时也导致从这条主线中分化出了无数条斗气修炼之法,所谓手有长短,分化出来的斗气修炼之法,自然也是有强有弱。经过归纳统计,斗气大陆将斗气功法的等级,由高到低分为四阶十二级:天.地.玄.黄!而每一阶,又分初,中,高三级....................
复制代码 生成器效果(pickTopN:N=3,狗屁不通)
- 这个故事所造成的后果,便是造就了大批每天东在这样年,前,萧仅有是自己的萧的摇了摇头,道,就等因为炼了,才造就出三的天修炼天,的同样非也是有些有些异的儿一直在倒是,废,的分了,然便想要不定斗气大月月月月的定。透明的,方价脸有多中为不可是。你说完师到后气会让对,我不可以时,他倒是在乎这种高到功法的斗技出其种有些不愿的吸手一道,斗气,萧家现上,是这事,不是这个修有程体的什纸契到这片的小脸!三老,我光在萧战一巴掌,双中,是一个灵到的常识。心吧?望着萧炎那些神有些恍点不想受你的美的,用气忽然,传进你耳枚的属散,另次我前便是对着身空的长出身也只有想起,不,萧炎哥以说的造,的时候,他的道:你修门成为自然是各种天材少年老,一声冷静的望着对面的在一,手中,了下来的事,,你向了角落阵嘲笑,微有着不份还眼角散的,萧炎牙齿在桌面,上下没被等级之人的强化,并且他这老难,还是难去人的说过别的功,而且这几年,还要是分,同,你的要求,这几年实条,听过你有一年的,,你成就是我萧炎的面庞,萧战叹了口沾染鲜之的手一,在白纸之名为斗成为你!你是没搞的鬼?嘿人当失也了口之事发。萧动那小娃冷的的老头,笑眯眯凝重的道,这是这事所的的事,,你当还在一年时知,三年之前,你成年自然宛如疯天阶十属,所以,有云岚宗宗,更强有的么还年轻指的戒路,萧炎愕然了转。萧叔之时,萧炎却才有一星大者,在真真切切的。当药的,庞一瞪,手指惊颤的斗着萧炎心里一好气得俏脸忽些,不炎轻重的:自然也造就了他不的老师,云岚一宗,虽然有家,小脸,那双宛如轻疑般待遇这老然药,所的,这里,有种,都会身到这里许,自会不攻,微!父头一动容。丹有一种条件。首位的上,然必要进道,斗气大陆人,一种个灵魂,竟与什天,今事悔婚之种事,总的记不得萧,也将会被各方势力可惜手间中到时的变,那将老:想家老师?闻言一笑声,竟一手掌萧上,猛的之时响,再让你看看你就身也只清出了岁的事方与大一家,,萧叔叔,今天这种高深的吐了一口气少,那便是以事再次开始修炼中,萧后,萧炎会了一辈子不废物玩区,当然还是在炼黄之气!炼药之术之神,而有的得发了,那便请回好下去。药时,需前说自身属性的灵魂重却,火焰属于他便是一种发愣到斗者更让修!一老人手中有聚药老成年自己这几年,看来到,你以为了天他在云月上片刻下,也并不少在纳低嫣道对明公你,纳兰上然了起着些白老的魔此,你这本我还年轻间,还今的你我已经知为,至九品的先是,萧炎那些回成,无奈的身视了可
复制代码 基于SEQ2SEQ模型实现英文翻译器
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...
基于GPT2架构实现聊天机器人
训练数据:50W日常聊天语料
备注:以下是训练数据事例,每一个回复以" "空格分隔,每一段对话以换行/n分隔,以一段对话为一条训练数据
- 少侠好眼力 少侠啥时候来北京 遥遥无期你又没时间
- 哥怎么这么帅 是吗?谢谢嘞 和小鲜肉一样。嫩嫩的
- 你不怕掉下去啊 这是海拔米我觉得不够高 注意安全
- 你这文案写的我有点感动是怎么回事 哭没得 没有咧
- 都考上 小仙女决定满足你这个愿望 因为我有魔法棒
- 啥时候看演唱会 上海站好像延期了,不知延到啥时候本来是五月中旬 靠你了
- 大哥难道是求婚啦! 不不不大哥还没有这么速度呢随便拼着玩儿的 嘻嘻好看
- 中午老大爷遛弯去了么 对呀,哈哈。 转发这条咸鱼,今年必有好事儿发生。
- 我的爱情独白就是清空我的购物车 沉迷于一夜暴富不可自拔的身家过百元的贵妇 只想发财只想发财只想发财,对脱单好无兴趣
- 自己用啊 我有 可是那张不用钱的嘢 那要是里面没钱呢 无钱再刷自己的卡 哈哈哈哈哈哈哈哈这样就很不道德了 没有没有
- 第一张是藤椒鸡吗! 嘻嘻嘻对一家好次川菜的椒麻鸡! 这几天牙疼但是一直在想这种辣辣的鸡 嘤嘤嘤就是这种时候会想吃辣
复制代码
模型参数
- // gpt 124M参数量
- maxLen = 128 //最大token数
- embedDim = 768 //embeding编码维度
- headNum = 12 //多头注意力头数
- decoderNum = 12 //解码器层数
- learnRate = 0.0001f //学习率
- epoch = 3 //循环训练次数
- dropoutRate = 0.1f
- train_data = 450000 //训练集数量
- vail_data = 50000 //验证集数量
- train_loss = 1.08f //最终训练集损失在1.0左右
- vail_loss = 1.2f //最终验证集损失在1.2左右
复制代码
推理效果图
基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多GPU训练 ...

链接:https://pan.quark.cn/s/d8bb84031bd2
提取码下载:
|