Azure99 最近的时间轴更新
Azure99's repos on GitHub
C# · 371 人关注
GenshinPlayerQuery
根据原神uid查询玩家信息(基础数据、角色&装备、深境螺旋战绩等)
Python · 131 人关注
BlossomLM
中英双语对话式大型语言模型
Java · 25 人关注
AlgContestInfo
近期算法竞赛信息爬虫, 支持Codeforces/LeetCode/牛客网/洛谷等常见OJ
C# · 17 人关注
EasyFPSViewer
A viewer for Freeproblemset.
Python · 9 人关注
BlossomData
A simple way to synthesize LLM training data. (under construction⚠)
Java · 7 人关注
JerryFramework
A simple, self-hosted, convention-over-configuration Java Web Framework 🌠 Less nonsense, more features!
C# · 5 人关注
AutoACMachine
真*自动AC机
Go · 4 人关注
cvm-blaster
Automatically create/destroy/backup/restore tencent cvm instance.
4 人关注
GFW_White_Domain
大陆域名白名单
2 人关注
azure99-mania
My osu! mania skin
C# · 2 人关注
freeproblemset
freeproblemset is a standard for acm-icpc contest problem storage in xml
0 人关注
abcd
Python · 0 人关注
AlignBench
大模型多维度中文对齐评测基准 (ACL 2024)
JavaScript · 0 人关注
AndroidAceEditor
Ace editor for use in android apps
Python · 0 人关注
AutoAWQ
AutoAWQ implements the AWQ algorithm for 4-bit quantization with a 2x speedup during inference. Documentation:
Python · 0 人关注
bce-qianfan-sdk
Provide best practices for LMOps, as well as elegant and convenient access to the features of the Qianfan MaaS Platform. (提供大模型工具链最佳实践,以及优雅且便捷地访问千帆大模型平台)
0 人关注
Clash.Meta
A rule-based tunnel in Go.
0 人关注
cloudflare
0 人关注
copilot-analysis
C++ · 0 人关注
dlssg-to-fsr3
Adds AMD FSR3 Frame Generation to games by replacing Nvidia DLSS-G Frame Generation (nvngx_dlssg).
0 人关注
dps
:tangerine: a way to make skeleton screen, 一种自动生成网页骨架屏的方式
0 人关注
hueman
Hueman WordPress theme is one of the best rated theme for blogs and magazines on WordPress.org. Powers 70k+ websites around the world.
JavaScript · 0 人关注
hustoj-1
Popular Open Source Online Judge based on PHP/C++/MySQL/Linux for ACM/ICPC and NOIP training, with easy installation. 开源OJ系统
0 人关注
JustTrustMe
An xposed module that disables SSL certificate checking for the purposes of auditing an app with cert pinning
Python · 0 人关注
LLaMA-Factory
Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM)
0 人关注
moonlight-android
GameStream client for Android
0 人关注
MyPAC
自用
0 人关注
nas-tools
NAS媒体库资源归集、整理自动化工具
Azure99

Azure99

V2EX 第 296249 号会员,加入于 2018-03-03 18:28:27 +08:00
今日活跃度排名 15873
根据 Azure99 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Azure99 最近回复了
48 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@japhetJiu 你说的这些主要是用于部署推理服务,并通过 RAG 框架调用。KoboldCPP (推理框架)、HF 的模型(模型权重 通常是对齐后的模型,一般带有 Chat 或者 Instruct 字眼)、AnythingLLM ( RAG 框架)。

如果希望训练自己的模型(假设你是做微调,就是让预训练模型从只会续写文本变得"会说人话"),应该找一个训练框架,比如 ms swift 、llama factory 、xtuner ;再去 HF 下载预训练模型(没有经过对齐的 通常带有 Base 字眼,或者没有 Chat 等字眼);并且找一些数据集进行微调。上面列举的框架基本都有简单教程和数据集,当然如果你愿意用我的数据集,那就更好了。
建议不要打着分享创造的名义发推广贴(尤其是标题党+商业行为),直接套一个 text2image 能算是创意?
Huggingface 上大把效果不错的模型,用心找一个好点的不行么。
放个之前搞的 demo ,https://huggingface.co/spaces/Azure99/blossom-playground-v2.5 ,没有因为媳妇的一句话就开发,也没有会员订阅,也没有使用限制
![.jpg]( https://s2.loli.net/2024/07/29/NKO6hsUI1CFyMm3.jpg)
52 天前
回复了 shinonome 创建的主题 Python 函数的返回建议是 list|[] 还是 list|None 呢
你认为字符串""和 None 语义一样么?很显然是不一样的,""是一个空字符串,而 None 不表示任何数据。
所以 2 楼就是优解,如果它是空的,那么返回空 list ,如果有异常,直接抛出异常。不要返回 None 。
52 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@japhetJiu 第一个问题已经回复过了
对于第二个问题,因为硬件资源的限制,这个 demo 是 4bit 量化后的,精度下降比较严重。
可以用 HF 上的 demo https://huggingface.co/spaces/Azure99/Blossom-34B-Demo ,不量化太狠是非常容易解决这个问题的。
https://imgur.com/qDdfX18
如果我掏出 Map<String, Map<String, Object>>,阁下又该如何应对?
您找的是不是:snowflake
102 天前
回复了 wencan 创建的主题 程序员 想白嫖点大模型的 api
没必要,langchain 适合做实验的时候快速的把想法跑起来,以及对比各种同类组件的效果。上生产还是自己写最舒服灵活,另外 langchain 经常有破坏性变更/bug ,所以不建议。
135 天前
回复了 Azure99 创建的主题 程序员 分享一下自己训练的大模型
@1314258 很传统的 RAG ,query 改写,搜索,拼 prompt 一条龙
139 天前
回复了 xiaocaiji111 创建的主题 程序员 这芋道源码太恶心了吧?
不是,真有人捏着鼻子看这玩意啊?😃
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   885 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 20:27 · PVG 04:27 · LAX 13:27 · JFK 16:27
Developed with CodeLauncher
♥ Do have faith in what you're doing.