记录一下在task2过程中学习到的知识点,以及放一下最终task2的连环画效果图,部分内容生成自 deepseek 代码助手V2
pythonos.makedirs("./data/lora_dataset/train", exist_ok=True)
os.makedirs
用于递归创建目录,exist_ok=True
表示如果目录已经存在,不会抛出异常
pythonwith open("./data/data-juicer/input/metadata.jsonl", "w") as f:
"./data/data-juicer/input/metadata.jsonl"
用于写入,文件模式为 "w"
。with
语句确保文件在使用完毕后自动关闭。pythonfor data_id, data in enumerate(tqdm(ds)):
// ...
metadata = {"text": "二次元", "image": [f"/mnt/workspace/kolors/data/lora_dataset/train/{data_id}.jpg"]}
f.write(json.dumps(metadata))
// ...
enumerate(ds)
会生成一个包含索引和对应元素的元组序列,这样你就可以在遍历 ds
的同时获取每个元素的索引
tqdm()
显示进度条
metadata = ...
:创建一个包含文本和图像路径的元数据字典,注意第二个kv对的value保存一个列表,这种结构的设计可能是为了灵活性,允许在未来的扩展中包含多个图像路径,即每个json对象的image可以有多个图像的路径
f.write(json.dumps(metadata))
:将元数据字典转换为 JSON 字符串并写入文件。
json.dumps()
将 Python 数据结构(如字典、列表、字符串、数字等)序列化为 JSON 字符串
python!dj-process --config data/data-juicer/data_juicer_config.yaml
调用一个名为 dj-process
的命令行工具,并使用 --config
选项指定一个配置文件,这代码通常出现在 Jupyter Notebook 或其他支持魔术命令的环境中,用于执行外部命令。!
符号用于执行系统命令。它允许你在 Notebook 中直接运行 shell 命令
使用deepseek生成提示词
1、古风,水墨画,一个穿着校服的少女,坐在教室里,认真听讲,上半身,黑色长发,眼神专注 2、古风,水墨画,一个穿着校服的少女,趴在课桌上,闭着眼睛,开始打盹,上半身,黑色长发,表情放松 3、古风,水墨画,一个穿着校服的少女,站在一条古色古香的小路边,准备进入梦乡,全身,黑色长发,眼神迷离 4、古风,水墨画,一个英俊的王子,骑着白马,沿着小路缓缓而来,全身,金色长发,眼神坚定 5、古风,水墨画,一个穿着校服的少女和王子,站在路旁,相谈甚欢,全身,黑色长发和金色长发,两人面带微笑 6、古风,水墨画,一个穿着校服的少女和王子,一起坐在马背上,沿着小路前行,全身,黑色长发和金色长发,两人并肩而坐 7、古风,水墨画,一个穿着校服的少女,从梦中醒来,坐在教室里,全身,黑色长发,眼神清醒 8、古风,水墨画,一个穿着校服的少女,回到学习生活中,坐在教室里,认真听讲,上半身,黑色长发,眼神专注
放入每张图片的正向提示词中,负向提示词不做修改,经过拼接得到最终结果
本文作者:cutelemon6
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!