个人channel,记录生活与发现
频道聊天室:https://t.me/fishome
频道聊天室:https://t.me/fishome
Spokenly丨另一款丝滑的 AI 语音输入工具
https://spokenly.app/
诸位,现在非常兴奋地给大家介绍 Spokenly,从昨晚到今天,大部分时间我都在探索使用和优化转录后的 AI 提示词,体验上乘。目前免费,作者提到后期可能为 GPT-4o 这种云端转录模型分付费层级。我现在已经将 VoiceInk 替换为 Spokenly,并留待观察。
Spokenly 输出输入极其丝滑,UI 舒服。你可以在不同软件 Hover 状态栏的时选择不同指令,它明显地区分了转录和 AI 处理两个阶段,所以你可以随时使用转录或者转录加 AI 处理语音。这很好地解决了 AI 语音输入在电脑端反应较慢的问题,当你说一些短内容直接用转录时,它输出非常快,如同微信输入法这些工具。当你突然觉得自己说得过多,不想直接转入,需要 AI 处理时,你可以通过 Hover 状态栏使用你需要优化的选项。这非常快,目前我非常长的提示词,它处理和转录相当,甚至更快。
谈到转录模型,它接入了非常多在线和本地,以及可以实时查看转录文本的模型。比如我目前使用的顶级多语言模型 ElevenLabs Scribe,还有 GPT-4o mini Transcribe 和实时转录的顶级 Nova-3(可惜只能英文识别)。它的模型直接选择使用,也可以接入 API,极其方便。目前我使用的 Scribe + Gemini 2.0 Flash 的转录和处理。Spokenly AI 提示词也可以设定每个应用独立的提示词和快捷键搭配,甚至自定义读写快捷键。当然这里有个缺点,它不能全局使用某个提示词(加快捷键解决),以及某个提示词不能应用于多个应用,但后面版本更新很快。
另外,它还有个指令功能,可以说开局全靠一张嘴。不过前面我也说过「AI 语音输入法」它最好使用状态是分阶段和分任务,即它作为语义的输出输入极佳。它可以通过指令打开网页、软件以及快捷指令,你可以在语音中加入特殊识别词触发,这就很有未来感。比如你使用语音打开 Gemini AI 处理网页。
我发现 Spokenly 的作者非常有侵略性,构建人机交互,以及将 Spokenly 2.0 视为脑机接口版本。AI 语音语义传输确实是进入脑机接口前的替代方案。作者在 Reddit 这篇帖子吸引了很多用户,他们基本尝试过各种语音方案 WisprFlow/ SuperWhisper/ MacWhisper 以及 VoiceInk 这些新语音工具,MacWhisper 作者也有回复。关于这类工具建议看看这个帖子。
今天我花了大部分时间去优化我的语音处理提示词,使用 Gemini Canvas 和 Grok 协助优化了无数版本,目前这个版本是最顶级和满意的。提示词很长,很多板块,我看重的比如说关于文本格式和规范,中文双引折扩号、中西文间距规范,以及「的、地、得」用法。更重要的是它解决了目前大多语音提示词总是会执行命令的错误,比如这些工具的默认提示词,我这里主要引入了「指令钝化」以及「极致忠诚」原则,再加一些 Few-shot 示例,基本不会再执行任何指令文本。当然可能偶尔会有些幻觉,足矣。(放评论区)
还是那句话,语音输入法大家必须用起来,训练起来。训练自己的思维习惯、说话节奏和表达,这太重要了。从双拼到现在,扎实地进步。
这篇文章前期一次成文,后面作修改和校准处理以及结尾补充。这两个过程我都太享受了,之前我的创作过程写长文初稿很难受,其实我不喜欢打字。我喜欢去修改和「偶遇」,所以迷恋于每个字词句和文本的处理。这是有害的,它让你的思维有损、不连贯,甚至极大概率走向其他。
现在两个流程都打通了,前期的语义输出和我表达结合,后期修改处理和增删邂逅,这才是写作的好状态啊。
我这个提示词基本上是以创作者习惯来优化的,它完全遵照语义原文,你们可以仔细研究下。因为我很看重我的思考和原初表述,哪怕是字和词的前后结构。
相关链接:
AI 语音输入法丨如何 X10 倍提升我的思维传输效率
#ai #tools
https://spokenly.app/
诸位,现在非常兴奋地给大家介绍 Spokenly,从昨晚到今天,大部分时间我都在探索使用和优化转录后的 AI 提示词,体验上乘。目前免费,作者提到后期可能为 GPT-4o 这种云端转录模型分付费层级。我现在已经将 VoiceInk 替换为 Spokenly,并留待观察。
Spokenly 输出输入极其丝滑,UI 舒服。你可以在不同软件 Hover 状态栏的时选择不同指令,它明显地区分了转录和 AI 处理两个阶段,所以你可以随时使用转录或者转录加 AI 处理语音。这很好地解决了 AI 语音输入在电脑端反应较慢的问题,当你说一些短内容直接用转录时,它输出非常快,如同微信输入法这些工具。当你突然觉得自己说得过多,不想直接转入,需要 AI 处理时,你可以通过 Hover 状态栏使用你需要优化的选项。这非常快,目前我非常长的提示词,它处理和转录相当,甚至更快。
谈到转录模型,它接入了非常多在线和本地,以及可以实时查看转录文本的模型。比如我目前使用的顶级多语言模型 ElevenLabs Scribe,还有 GPT-4o mini Transcribe 和实时转录的顶级 Nova-3(可惜只能英文识别)。它的模型直接选择使用,也可以接入 API,极其方便。目前我使用的 Scribe + Gemini 2.0 Flash 的转录和处理。Spokenly AI 提示词也可以设定每个应用独立的提示词和快捷键搭配,甚至自定义读写快捷键。当然这里有个缺点,它不能全局使用某个提示词(加快捷键解决),以及某个提示词不能应用于多个应用,但后面版本更新很快。
另外,它还有个指令功能,可以说开局全靠一张嘴。不过前面我也说过「AI 语音输入法」它最好使用状态是分阶段和分任务,即它作为语义的输出输入极佳。它可以通过指令打开网页、软件以及快捷指令,你可以在语音中加入特殊识别词触发,这就很有未来感。比如你使用语音打开 Gemini AI 处理网页。
我发现 Spokenly 的作者非常有侵略性,构建人机交互,以及将 Spokenly 2.0 视为脑机接口版本。AI 语音语义传输确实是进入脑机接口前的替代方案。作者在 Reddit 这篇帖子吸引了很多用户,他们基本尝试过各种语音方案 WisprFlow/ SuperWhisper/ MacWhisper 以及 VoiceInk 这些新语音工具,MacWhisper 作者也有回复。关于这类工具建议看看这个帖子。
今天我花了大部分时间去优化我的语音处理提示词,使用 Gemini Canvas 和 Grok 协助优化了无数版本,目前这个版本是最顶级和满意的。提示词很长,很多板块,我看重的比如说关于文本格式和规范,中文双引折扩号、中西文间距规范,以及「的、地、得」用法。更重要的是它解决了目前大多语音提示词总是会执行命令的错误,比如这些工具的默认提示词,我这里主要引入了「指令钝化」以及「极致忠诚」原则,再加一些 Few-shot 示例,基本不会再执行任何指令文本。当然可能偶尔会有些幻觉,足矣。(放评论区)
还是那句话,语音输入法大家必须用起来,训练起来。训练自己的思维习惯、说话节奏和表达,这太重要了。从双拼到现在,扎实地进步。
这篇文章前期一次成文,后面作修改和校准处理以及结尾补充。这两个过程我都太享受了,之前我的创作过程写长文初稿很难受,其实我不喜欢打字。我喜欢去修改和「偶遇」,所以迷恋于每个字词句和文本的处理。这是有害的,它让你的思维有损、不连贯,甚至极大概率走向其他。
现在两个流程都打通了,前期的语义输出和我表达结合,后期修改处理和增删邂逅,这才是写作的好状态啊。
我这个提示词基本上是以创作者习惯来优化的,它完全遵照语义原文,你们可以仔细研究下。因为我很看重我的思考和原初表述,哪怕是字和词的前后结构。
相关链接:
AI 语音输入法丨如何 X10 倍提升我的思维传输效率
#ai #tools
https://voicenotes.com/?via=yandhi
最近入了款 AI 语音笔记软件 Voicenotes,它完全迭代了我的灵感笔记采集以及某些特定工作流的内容记录场景,号称最聪明的笔记采集工具,由 Buy Me a Coffee 的作者 Jijo Sunny 建造。
Voicenotes 可以无压记录任何语音并转述文本,你可以使用内置 AI 总结/分重点/理待办/生成推文和博客内容等。其中的个性化 Ask my AI、搜索系统以及每条语音的 Related notes 完全可以将你的灵感内容和输入统纳链接起来,邓布利多的冥想盆(Pensieve)这里再次显喻。
整体而言,Voicenotes 极简丝滑的风格/多端输入的场景/标签链接的整合都深得我心,尤其我这种每天充满大量信息噪音、输入倦怠、呓语和回响的状态,太需要无压卸载了,这也是我上次分享「Speech to Roam」插件那么欣喜的原因。目前我正在简单记录,晚上复盘时间完全使用 Voicenotes,太适合日记和个人状态评估了,以及某些交谈和重要会话都无压整理,完全的升级版「通义听悟」和「AudioPen」。
我比较看好这个笔记软件,已经放置手机底部停靠栏。目前入的 Voicenotes Believer 终身使用 50 刀,本身月付 10 刀,感兴趣可以入个终身,现在每月 AI Chatbot 都 20 刀,Voicenotes 还加持的 GPT4。记得可以通过分享上面我这种自己的 refer 链接以获取佣金。
相关链接
1 Speech-to-Roam丨Roam 语音转文本/调用 AI与笔记对话插件
2 为什么你应该开始用 ChatGPT 写日记|做笔记(Prompt 和自动化)
#TfT #AI
https://www.perplexity.ai/pro?discount_code=THANKS23
最近 Perplexity.AI 官方在 X 发布了感恩节大回馈,使用折扣码 THANKS23 免费领取 2 月会员。
Perplexity.AI 自去年 12 月问世以来,作为首个生成式整合搜索引擎(synthesis engines)现已集成多家最强模型,PRO 可以使用 GPT4,以及现在最新的 Claude2.1,值得一试。
Reference
Synthesis Engines丨Perplexity 作为我的整合搜索引擎
Perplexity AI 重新发明搜索引擎
#ai
AI 如何影响我阅读文章
所有 Never Ending Now 的新闻内容就像火山裂口岩浆里生生不息的气泡,对塑造整个人类世时间轴的地形地理毫无意义。这也是我很少分享新闻内容的原因,而对这些内容我现在基本都用 AI 看, 或者说毫无阅读体验,没有阅读难度的文章都可以 AI 阅读。
我对稍好文章的定义就是我用 AI summarized 两次,现在阅读体验也是越来越好,RWR 以前放的文章也已经处理大部分,确实解放了我的阅读,有更多时间专注书籍以及主题文献。
这里重点是我们需要区分知识和信息,两者必不可少,知识在我这里就是塑造实体,信息是塑造的外部环境(边界外),或者说系统和环境的关系,这里得到区分和统一,信息类文章承担的功能就是我们前面提到的 Antilibrary 以及大量阅读「囤积」的功能。
但时代变了,信息我们现在有更便捷更好的处理方式,我们确实可以放开阅读,AI 让我们边界外的世界变得广而明亮。不过这里需要提醒的是,我们仍在 LLM 拉出的废墟上探险。
我现在仍然是用 Glarity 总结文章,可以自定义总结模板,这里我就加了个标题,Prompt 都很简单。
Reference
「囤积」的功能
Antilibrary
LLM 的废墟
我的 AI COMBO 1.0
#AI
所有 Never Ending Now 的新闻内容就像火山裂口岩浆里生生不息的气泡,对塑造整个人类世时间轴的地形地理毫无意义。这也是我很少分享新闻内容的原因,而对这些内容我现在基本都用 AI 看, 或者说毫无阅读体验,没有阅读难度的文章都可以 AI 阅读。
我对稍好文章的定义就是我用 AI summarized 两次,现在阅读体验也是越来越好,RWR 以前放的文章也已经处理大部分,确实解放了我的阅读,有更多时间专注书籍以及主题文献。
这里重点是我们需要区分知识和信息,两者必不可少,知识在我这里就是塑造实体,信息是塑造的外部环境(边界外),或者说系统和环境的关系,这里得到区分和统一,信息类文章承担的功能就是我们前面提到的 Antilibrary 以及大量阅读「囤积」的功能。
但时代变了,信息我们现在有更便捷更好的处理方式,我们确实可以放开阅读,AI 让我们边界外的世界变得广而明亮。不过这里需要提醒的是,我们仍在 LLM 拉出的废墟上探险。
我现在仍然是用 Glarity 总结文章,可以自定义总结模板,这里我就加了个标题,Prompt 都很简单。
Your output should use the following template:
There is a title.
Summarize the highlights of the content and output a useful summary in 140 words in the form of Summary. Reference
「囤积」的功能
Antilibrary
LLM 的废墟
我的 AI COMBO 1.0
#AI
ChatGPT 插件介绍
70款ChatGPT插件评测:惊艳的开发过程与宏大的商业化愿景
以下是所有45个插件以及它们如何使用指南
10x Your Productivity With These ChatGPT Plugins
现在 ChatGPT 插件已向所有 Plus 用户开放,上面文章是对现有插件的评测/介绍和安利,这不得火速冲了。
#AI
70款ChatGPT插件评测:惊艳的开发过程与宏大的商业化愿景
以下是所有45个插件以及它们如何使用指南
10x Your Productivity With These ChatGPT Plugins
现在 ChatGPT 插件已向所有 Plus 用户开放,上面文章是对现有插件的评测/介绍和安利,这不得火速冲了。
#AI
终于可以稳定用网页版 Newbing 辽
Newbing 是我唯二高强度使用的 AI 工具,搜索系+建造系(稳定的 POE)。之前主要用本地版的 BingChat,最近宕机后又重新使用网页版插件打开 Newbing,但每次关闭或重启后它不会记住 Cookie,AI 功能总是消失,包括 Edge 浏览器。
New-Bing-Anywhere / Use new Bing in Chrome 都可以在网页状态使用 Bing AI,然后只需可使用状态下用 Cookie-Editor Export JSON 代码,复制并点击加号为 Newbing 加上这个稳定的 Cookie,就可以不用每次再清除 Cookie 插件刷新。目前 Edge 浏览器上稳定打开,即 Edge 装个 Cookie Editor 稳定网页 NewBing Cookie 就行。
Reference
我目前丝滑的 AI COMBO 2.0
#AI
Newbing 是我唯二高强度使用的 AI 工具,搜索系+建造系(稳定的 POE)。之前主要用本地版的 BingChat,最近宕机后又重新使用网页版插件打开 Newbing,但每次关闭或重启后它不会记住 Cookie,AI 功能总是消失,包括 Edge 浏览器。
New-Bing-Anywhere / Use new Bing in Chrome 都可以在网页状态使用 Bing AI,然后只需可使用状态下用 Cookie-Editor Export JSON 代码,复制并点击加号为 Newbing 加上这个稳定的 Cookie,就可以不用每次再清除 Cookie 插件刷新。目前 Edge 浏览器上稳定打开,即 Edge 装个 Cookie Editor 稳定网页 NewBing Cookie 就行。
Reference
我目前丝滑的 AI COMBO 2.0
#AI
🤖 Learn Prompting:教你如何与 AI 对话的开源免费教程
🔗:Web | GitHub
👉 Features:
- 关注 prompt engineering,即「同 AI交流,并得到你要的结果」
- 内容迭代更新迅速,欢迎提出 issue
- 注重实际应用场景和技巧
- 根据难度,为不同内容分级
- 支持多语言和关键词搜索
👩🏻🏫 课程的目的非常明确,就是如何更好地使用 Prompt 调动 AI,最终得到想要的结果。课程的适用范围比较广泛,涵盖 ChatGPT、Stable Diffusion、Midjourney 等常见 AIGC 应用
💡 我们能够从课程中深入浅出地学习 Prompt 的构成,如何根据不同的场景设计不同的 Prompt。虽然课程有中文版本,但翻译的水平一般,建议有能力的朋友直接阅读英文原文
🧐 我知道国内许多人利用信息差,在知识星球、私域群聊等平台赚了许多 AI 课程的钱,而 Learn Prompting 则主打知识免费共享、社区共建。我不想轻浮地 judge 绝对的对与错,只希望大家能够从课程中有所收获
👀 如果你想要阅读中文原生写作的 AI 课程,我也在此列举一些(含鲜明的拉群变现等国内特色):AI 研习社 | Midjourney 知识库 | AIGCtalker
📘 关联阅读:OpenPromptStudio - 开源 AIGC 提示词可视化编辑器
频道:@NewlearnerChannel
关于 AI 内容的超级聚合网站
AII AI News
这个只能说非常爆炸,关于 AI 的趋势/新闻/播客/视频,很多网站 AI 内容的聚合展示。前面我也分享了「关于 AI 资讯信息」的小专题,学术新闻等内容。
以及群友推荐的这个网站:hackertab.dev,同样平铺关于 Github/HN/ProductHunt 的所有趋势内容,很解压。
加速就完事儿了,什么焦虑/FOMO 不存在的,解决这些问题的唯一方法只有继续加速。
Reference
关于 AI 的资讯信息
#AI
AII AI News
这个只能说非常爆炸,关于 AI 的趋势/新闻/播客/视频,很多网站 AI 内容的聚合展示。前面我也分享了「关于 AI 资讯信息」的小专题,学术新闻等内容。
以及群友推荐的这个网站:hackertab.dev,同样平铺关于 Github/HN/ProductHunt 的所有趋势内容,很解压。
加速就完事儿了,什么焦虑/FOMO 不存在的,解决这些问题的唯一方法只有继续加速。
Reference
关于 AI 的资讯信息
#AI
The Top AI Newsletters on Substack in 2023
Substack 的人工智能频道系列推荐,AI 延生出的很多相关有趣的信息源。
Reference
关于 AI 的资讯信息
#AI
Substack 的人工智能频道系列推荐,AI 延生出的很多相关有趣的信息源。
Reference
关于 AI 的资讯信息
#AI
📩 接读者来稿,他向我们推荐了他开发的音频识别软件
🤖 WhisperNotes - 利用Whisper模型的本地语音转文字「速记」App
Mac、iPhone和iPad App:App Store
🚀 Features
- 模型全部存储在本地,无需网络权限,录音不会被上传
- 支持多种语言混合识别
- 识别的正确率较高
- 转换完后,生成的文字就会自动复制到剪贴板
- macOS 支持导入长音频进行文字识别
📝 作者的创作灵感
我可以用它来记录梦境、发长微信,或捕捉转瞬即逝的灵感。
因为软件的目的是「速记」,所以Whisper Notes的"日记"属性很弱。转录完,文字就会自动复制到剪贴板,你可以粘贴到微信、或真正的日记/Memo软件来整理。
🙋♂️ 使用体验
这款软件的创作初衷很有意思,主打的是「灵感速记」的功能,在实际体验中确实用起来还是比较方便的,但可惜在iOS端没有做一个“小组件”的功能,否则会更加好用。
由于软件的模型都存储在本地,因此隐私问题完全不用担心,不过这就导致了App的大小有点大,手机上就接近了500M,电脑上更是达到了1.4G。
好在Whispernotes识别文字的准确率确实非常高,在我测试的十句中英混杂的语句中,只有其中一句的一个词出现了错误。
频道:@NewlearnerChannel
awesome-chatgpt-zh 收集了各种免费和付费的ChatGPT资源,以及如何更有效地与ChatGPT进行交流的方法。
感谢网络Du Bo的投稿!
🏷 TAG #GitHub #AI
📢 Channel @opencfdchannel
👥 Group @open_source_community
感谢网络Du Bo的投稿!
🏷 TAG #GitHub #AI
📢 Channel @opencfdchannel
👥 Group @open_source_community
Chat-GPT 全局网页侧边栏插件丨调用重器
ChatGPT Sidebar,非常爆炸。刚隔壁群看到 LunaBot,顺便找到了这个全局网页侧边栏插件。
Chat-GPT 调用,有会员可以直接使用 plus;选中文本侧边栏按钮会高亮,点击即复制到文本框;可预制任意 prompt 提示框;UI 丝滑舒服。真正将 Chat-GPT 拉出了超级挂件,你可以在 Readwise Reader 阅读书籍时(比 Ghost 好用很多),划选文本点击按钮给你解释,总结和提取;也可以在使用笔记软件时为你笔记润色,翻译和补充。Chat-GPT 以更方便的窗口在你身边折叠。(上一次比较兴奋的全局插件还是 Readwise Highlighter 这种全网页标注)
之前就想过这种插件,准备常驻。另一个我很需要的是嵌入输入框的 AI 处理,类似 Grammarly,可以吊打 Notion AI 系。
Reference
我的 AI COMBO
RWR
#AI
ChatGPT Sidebar,非常爆炸。刚隔壁群看到 LunaBot,顺便找到了这个全局网页侧边栏插件。
Chat-GPT 调用,有会员可以直接使用 plus;选中文本侧边栏按钮会高亮,点击即复制到文本框;可预制任意 prompt 提示框;UI 丝滑舒服。真正将 Chat-GPT 拉出了超级挂件,你可以在 Readwise Reader 阅读书籍时(比 Ghost 好用很多),划选文本点击按钮给你解释,总结和提取;也可以在使用笔记软件时为你笔记润色,翻译和补充。Chat-GPT 以更方便的窗口在你身边折叠。(上一次比较兴奋的全局插件还是 Readwise Highlighter 这种全网页标注)
之前就想过这种插件,准备常驻。另一个我很需要的是嵌入输入框的 AI 处理,类似 Grammarly,可以吊打 Notion AI 系。
Reference
我的 AI COMBO
RWR
#AI
AI智能打造梦幻房间:https://www.roomgpt.io/
AI去除照片不需要的部分:https://cleanupphotos.com/
AI作曲:https://mubert.com/render/pricing?via=jin-li
AI制作视频:https://replicate.com/deforum/deforum_stable_diffusion
图片一键变视频:https://www.myheritage.com/deep-nostalgia/
via:@lingdujieshuo
🏷 TAG #AI #工具
📢 Channel @opencfdchannel
👥 Group @open_source_community
AI去除照片不需要的部分:https://cleanupphotos.com/
AI作曲:https://mubert.com/render/pricing?via=jin-li
AI制作视频:https://replicate.com/deforum/deforum_stable_diffusion
图片一键变视频:https://www.myheritage.com/deep-nostalgia/
via:@lingdujieshuo
🏷 TAG #AI #工具
📢 Channel @opencfdchannel
👥 Group @open_source_community
🤖整理并分享一些基于「OpenAI + Vercel」的开源AI工具
全部都是开源的,并且都可以一键部署到Vercel供私人使用
1️⃣ 周报生成器:简单描述工作内容帮你生成完整周报
2️⃣ README 生成器:帮你生成完整 Github README
3️⃣ 邮件生成器:几秒钟内生成多语言商务邮件
4️⃣ Teach Anything:几秒钟内得到想要的答案
5️⃣ 聊天简化器 - 简化聊天记录内容
6️⃣ SiteExplainer - 输入网址,快速总结网站内容
7️⃣ Dear Aibby - 来自新机器灵魂的衷心建议
8️⃣ TextSummarizer - 在几秒钟内从文本生成摘要
9️⃣智能文案小助手 - 你的个人工作助理
📢关注频道:@geekshare
💬加入群聊:@igeekshare
📮欢迎投稿:@Geekshare_bot