A Journal Through My Activities, Thoughts, and Notes
HISTORY 源自 HIS STORY (他人的故事),这个他人,就是写历史的人。
这么来看,不必惊讶,历史本来就是令人随便打扮的小姑娘呀。
网上AI生成的插图,海报越来越多了。现在我们还能一眼识别出人工作品和AI作品,但不久的将来(也许就是下个月),人类将无从区别,或者极难区分二者的差异。

幸存的设计师和艺术家们将和幸存的程序员一样,成为掌握提问艺术的一类人。因为AI时代,唯有问出好的问题,你才能得到好的结果。
#网友语录 归根结底,人能真正拥有的,只有经历,或者叫体验。「@fomalhaut 有人说“一直一个人孤独 会比失去一个人之后再回到一个人的孤独好过一点吧”我不觉得诶,人生本是一场空,所有的经历才宝贵。反正最终都会失去,只有那些爱、感动、喜悦、温柔哪怕是痛苦的回忆才永远都是你的」
#网友语录 无比赞同。劝,但别期望迅速生效。也许某一天会生效,也许永远不会。要有平常心。「@是你的SSR 人不是会听劝的物种,但是输入会影响输出。」
今天订了minimax max年订阅,据说每个月有17亿token的用量,希望能解决动不动就5小时限额已用完的难题。

用了知乎某网友的邀请链接,省了10%,1071人民币。考虑到这是一整年的费用,不算多。

我现在有两个国内的年订阅(另一个是智普的),3个公司提供的claude code订阅,一个公司提供的copilot订阅。因为copilot计费由按请求数计费改成按token数计费。我的业余项目就不好意思再蹭公司账号了。这也是我最近频繁尝试国内模型的原因。尝试的结果,kimi,glm和minimax的顶级模型都堪用,唯独豆包的模型不大行。当然啦,我也只是浅尝辄止。

minimax的模型当然比不上opus和GPT,但我也不是什么任务都需要特别牛的模型。

这是我第一个max level的订阅,希望minimax也越走越好,竞争越激烈,我们能买到的token才越便宜。
火山引擎的coding plan(月费40RMB,约NZ$10)一点都不便宜。宣传上说有3倍Claude code额度纯粹是胡说八道。个人体验是0.5倍或更少。而且....一个月的额度其实是两个week限额。也就是说,如果你连续两个week都用满,后面两个多week你只能痴痴地等。这吃相太难看了。幸亏我也就只买了一个月试试水。
@27519 一个月后的今天,简直离开my-ai-team我都不会干活了。
#网友语录 黄火火不吃火锅

你面前有一个杯子
你喝水它是水杯
你抽烟它就是烟灰缸
你插花它就是花瓶
杯子本身什么也不是,这叫空性
你用它来干什么它就是什么,这叫妙用
你非要坚持它一定就是杯子,这叫住相
为此你不惜和别人争论抬杠,这叫我执
结果你抬杠有了情绪和谩骂,这叫烦恼
最后你对这个人产生了反感,这叫偏见」
老板给了第二个claude seat,现在token应该比较够用了。
七星!这是一本二十多年前的老书。为何现在还可以读,因为作者提出的“涌现”理论不仅改变了我们对于复杂系统的研究范式,对于当下AI机器学习等领域影响深远,而且由小生大,大不等于小的线性相加依然具有时代价值。

作者约翰·霍兰德教授是遗传算法之父,也是复杂适应系统理论的提出者。他曾参与IBM 701开发,是美国早期编程人员之一,后来长期任教于密歇根大学,身兼心理学、电子工程及计算机科学教授,同时也是复杂系统全球研究权威圣塔菲研究所核心主席。他是麦克阿瑟天才奖获得者,其理论不仅为AI的算法研发提供思路,还为经济学、生态学等领域解读复杂系统问题提供了科学依据。他的另一本著作《隐秩序》提出了“复杂适应系统”理论,用遗传算法解释城市、免疫系统等如何通过适应性自组织形成秩序,被誉为该领域的经典入门读物。

作者在研究中发现“复杂现象都是从简单的元素中涌现出来的”。涌现的鲜明特征就是“由小生大”。涌现行为是在没有一个中心执行者进行控制的情况下发生的。如此,涌现就仅仅发生在整体行为不等于各部分行为简单相加的情况下。以国际象棋为例。仅仅依靠累加棋盘上各个棋子的价值,不可能有效描述正在进行中的棋局。那我们是否能将人类的意识解释为某些物理系统的一种涌现属性?“本书最主要的目的就是提供有说服力的证据,证明科学研究将大大加深我们对涌现现象的理解。”因为涌现现象在许多不同的学科中普遍存在,所以我们的探讨也要跨越多门学科。

棋类游戏是人类的奇妙作品。它是从简单的规则或规律涌现出复杂事物的典型例子。建模是研究的有效方式,而忽略细节是建模的本质。模型必须比与之对应的实物简单。积木块代表共同元素,通过删除细节得到积木块,并且遵循限制条件将积木块进行组合,即建模。通过建模让模型帮助人类预测未来。计算机模型把棋类游戏、数字和积木块表现的主题很好地结合在一起。地图很适合帮助我们更深入地理解数字和模型之间的关系。工程技术术语制图在数学中被用来精确定义函数,对应的概念为“映射”。我们就可以借助这些重要的数学工具,对涌现系统建模。

在复杂的博弈中,策略对于有效的博弈来说至关重要。博弈树为策略的表述提供了一个精确的方法。可以使用函数来定义从博弈状态到策略所决定的动作之间的对应关系。通过重复博弈,发现并组合积木块(经验法则和博弈特征)构建起可行的策略。混沌理论是指在规则明确的大规模系统中,局部条件的微小变化能够引起全局范围内长期行为的巨大改变。有了框架之后,我们将更仔细地研究针对涌现的预测——何时、何地、何物。在动态模型的构建中,计算机模型发挥着关键作用。

“学习”目标就是随着博弈实战经验的积累,不断改进预测及相应的策略。一个常识,博弈越临近尾声,局势就越明朗。调整权重的程序能够充分发挥最大最小策略的作用。涌现的研究重点在于选取那些用于构建模型的规则,即如何从世界上很多无法预料的现象中,总结出有效揭示它们的规律的。涌现最初是一种具有耦合性的相互作用的产物。在技术上,这些相互作用以及这些作用产生的系统都是非线性的。“真理来源于失败而不是混乱。”诗歌和物理学在过程上的相似性和结果上的差异同样值得研究。

8个要点:1.涌现现象出现在生成系统之中;2.在这样的生成系统中,整体大于各部分之和;3.生成系统中一种典型的涌现现象是,组成部分不断改变的稳定模式;4.一个稳定模式所在的环境决定了它的功能;5.稳定模式之间的相互作用带来了约束和校验,随着这样的模式数量的增加,系统的“能力”也会增强;6.稳定模式通常符合宏观规律;7.“存在差别的稳定性”是那些产生了涌现现象的规律的典型作用结果;8.更高层的生成过程可以由强化的稳定性而产生。

在复杂适应系统中,最优化状态几乎不可能达到。“有价值的创新应该是一种权衡性的组合,往往介于明显拼凑的组合和不可能实现的最佳组合之间”。“多数科学家都认为生命是涌现现象,但在意识问题上,他们的看法就不一样了”。“在确切地知道哪些生命和意识的现象及问题可以通过涌现现象进行解释之前,我们对宇宙万物的理解都是有限的”。作者二十多年提出的关于意识等问题,随着大语言模型的逐渐成熟,已经“涌现”出可能的答案。

#网摘 囊萤映雪 评《涌现》
#网摘 木遥 使用 AI 做任何项目的最大秘诀是你要不断在两个方向驾驭它。
一个方向是显然的:你要 push 它完成目标
一个方向不那么显然但同样重要(甚至更重要):你要不断压缩它引入的混乱(或者说熵),换句话说,你要锲而不舍地给它擦屁股。

AI 的天性是攻其一点不及其余。所以你放任它自发完成任务,它会为了给你炒一盘鸡蛋西红柿而把整个厨房炸掉,然后问你「你就说鸡蛋西红柿好不好吃吧。」大部分人上手用 AI 做项目,一开始都失败在这里:它创造出了一个可用的东西,但混乱的成长速度压过了功能的成长速度,然后在某一个崩溃成一团无法修复的乱麻,治丝益棼。

第二个方向更需要人:人的经验、品味、调度能力、节奏感。人比AI对混乱的本质更敏感,也对混乱中什么是真正该留下来的东西更有洞察力。

Ironically,一旦你指出了混乱所在,AI 本身可以成为清理混乱的好帮手。它比你更善于收拾厨房。它只是懒。
用才是最好的学。之前想学tmux,启动了好多次,都半途而废了。因为不是刚需,又有更熟悉省力的退路,会不会用tmux影响不大,都能把活干完。用熟悉的工具或许还能干得快一点儿。

但这次做agent自主communicate的工具,tmux成了必不可少的一环,少了它就跑不起来。所以这次不得不用,很快就形成肌肉记忆,真正学会了。
详尽的system prompt当然占用token,但短而模糊的指令更糟。到得到同样结果那一刻,搞不好后者会用掉更多的token。
#网摘 管埋员 结婚就是用麻烦代替孤独,有人不怕麻烦,有人不怕孤独。(😄还有一些人不结婚但也根本就不孤独。在我看来,婚姻只是一种选择,和很多其他的选择没有本质的不同。
#网摘 Dora 推荐图书 Inner Game of Tennis

①对我们大多数人来说,我们很容易陷入自我批评,这会进一步抑制我们的表现。我们需要从错误中吸取教训,但不要过于纠结。

②​培养对自己的深度信任和专注技能一直是个人内在游戏的目标,也是教练工作的目标。
公司注册申请已经批了,我也是小企业主了。我现在是X公司全职员工,H公司兼职雇员,S公司Owner兼Director。不过我发现我去错的了地方,没有直接去政府网站申请,而是被Company Hub先薅走了$150羊毛。不过他们服务确实很好,所以那是人家该挣的钱,不是羊毛。
公司注册申请提交了。从想注册到完成注册申请花了不到一个小时。不出意外,过几天新西兰就又会多一家小企业了。lol 而我只是想拿点商家优惠。谁知道呢,没准儿一家未来的牛逼新西兰公司就在今天诞生了哈哈哈哈。
很久没吃发面饼了。结果,今天的晚饭就是发面饼!太意外太惊喜了。
经过两周多的密集开发,my-ai-team 现在有五个session mode: team/adhoc/explore/live/qa。team/adhoc/qa 模式主要独立自主的运行,explore/live人机交互较多。所有模式都支持用telegram 远程控制。这基本上满足了我工作和个人项目的需要。接下来就是确保它跑的又快又好。我很欣慰的一点是,即使这么痴迷,我也还是保证了早睡早起。
我的AI TEAM里最近加了一个新角色,QA。它专门负责在最近合并的PR里找bug。如果周限额很快就要重置了,但手头没有Ready的任务可做得话,就把QA放出去找bug。如此这般,充分利用剩余token来提高code quality,效果还真不错。好开心。(还是穷....要是能上大套餐就不用这么扣扣索索了)
Back to Top