用Cursor打造大模型竞技场:最会整活的居然是它
有想法学习简单的python编程时,最固有的思维就是通过课程来具备基础的编程能力。至少我书架上还躺着一本落灰的《Python 编程从入门到实践》,B 站收藏夹里放着的《Python全套课程》视频。
可是在Twitter 上,Cloudflare 副总裁发了个视频,展示了自己 8 岁的女儿如何利用 Cursor AI 在 45 分钟内搭建好一个聊天机器人。看完后震惊不已,感受到了什么叫工具改变世界,工具降低门槛,工具提高效率。
在震惊的同时我们不妨先去看看Cursor:
Cursor 是一款人工智能代码生成工具。可根据用户的自然语言描述生成代码,帮助开发者提高编程效率;Cursor支持常见的高级编程语言(Python、JavaScript、Java、C++、C#、Go、Rust、Ruby)。Cursor AI 在代码补全的质量和速度上通常都要比GitHub Copilot 和 Super maven AI 要强,因为它装备了 Copilot++。搭建了GPT-4、GPT-4o和Claude 3.5 Sonnet等模型,通过与大模型的对话,能够自动生成代码,甚至实现了“0手工代码”的梦想。
在Cursor博客中依然可以看到这么一段话:我们的目标是创建一个神奇的工具,以编写世界软件为目标。
Cursor 已被广泛认为是使用 AI 进行编码的最佳方式。我们已经发展到超过 40,000 名客户,其中包括一些世界上最具创新性的初创公司、著名的研究实验室和有价值的企业。
快速上手指南
这两天我也在体验 Cursor(官网https://www.cursor.com/), Cursor界面很简洁,常用的两个功能:写代码(Ctrl+K)和对话(Ctrl+L)。
我把Cursor看做是VS Code的终极进化版,它是Code的Fork版本,各种功能基本一样可以无缝导入过来,但是在AI方面就做的好的太多了,它不是像GitHub CoPilot的那样以插件的形式植入软件,而是原生的,天然的就支持AI。还可以输入API Key,调用自己炼的模型。
Cursor 在多行编辑、跨文件上下文补全、提问、下一个动作预测,这些细节,Cursor 的处理速度更快,结果也更准确。体验感确实惊艳。聊天,Chat 允许你与看到你的代码库的 AI交谈。聊天室始终都可以看到你当前的文件与光标。
我集中测试了一下这款软件,在不写任何一行代码的情况下,开发一款Chrome的浏览器插件,主要功能是用大模型去总结网页内容:
当我在word上面把这些都写完之后复制下来,通过控制面板打开Chat聊天界面,全部都粘贴进去,那接下来的体验就跟咱们之前使用ChatGPT和Claude基本一样了。Cursor只用了几秒钟就理解并且拆解了需求,它告诉我们要创建哪什么文件,每个文件的名称和代码都给到了,这个时候我们只需要根据指示把文件创建好,把对应的文件开着,然后再点击Apply,AI会把代码自动填进去。
Apply功能特别特别方便,因为在debug的过程当中肯定要修改代码的,那Cursor不会把代码全部都给你再生成一遍,那样就太慢,太消耗Token了,对吧?所以它只会输出需要修改的那几行,Apply功能会自动找到需要修改的位置,用红色标注出来原来的代码,用绿色标注出修改的代码,确认之后它才自动替换。
等我们把所有代码都贴进文件里,就可以开始测试了。打开浏览器的插件页面,进入开发者模式,打开代码所在的文件夹就可以加载插件了。
为了验证,我找了个网页,也都总结成功了。
大模型竞技场,稳构多人游戏框架
借助Cursor搭建一个多玩家、淘汰制多彩贪吃蛇大战的游戏,游戏开始面临障碍物以及多条蛇,如不能躲避撞障碍物或躲避自身则被淘汰,得分高获胜,排名按分数从高到低排序。Cursor,新建文件夹通过Ctrl+K的快捷键调出代码补全或者提示功能框,Cursor给到我的代码大部分是能直接无误的运行起来的,当你对某段代码理解不清晰时可以直接在Cursor对Chat提出疑惑。
结果如下(Cursor:绿色 豆包:黄色 Kimi AI:蓝色 文心一言:红色):
豆包编程,作为字节跳动旗下的一款AI编程助手,提供了智能代码补全、代码解释、代码审查等多项功能。这次的测试主要用的是python语言,它在我提出要求的同时还给出了编写建议,以及在这开发过程中提供代码解释、代码审查、问题修复等一些辅助功能,这些功能类似于GitHub Copilot。
Kimi AI在生成的代码运行中有报错情况,尽管尝试通过多次对话来修复代码错误,可以成功解决问题,但是Kimi AI在编程能力方面还是存在明显的局限性,无法快速有效地处理复杂的编程任务。
文心一言对复杂逻辑的理解和处理能力不足,不能准确快速理解开发者的意图,生成的代码与实际需求存在偏差,在我的运行中是有存在几个语法错误和逻辑错误。理解和处理不够准确和熟练,有影响到代码的生成质量。
其他实例:
用过的两个例子,对于我来说算是十分实用的,再也不用瞎编正值表达式了。
1、正值表达式
我的输入是:用Java写程序,功能是从HTML中提取出img和video的src属性
2、反爬虫:
爬虫易伪装、用代理IP绕过限制,反爬虫存在误判正常用户风险,二者技术不断对抗且爬虫获取数据方式多。在保护网站资源避免被过度占用,保障数据安全隐私,维护网站运营秩序,防止内容被不当使用。我对Cursor的描述要求是:利用反爬虫写一份,IP访问频率控制和用户代理检测以及请求路径检测代码。
Cursor高效且准确的把代码完整的表达出来了,自动生成文件。面对如此长篇的代码,是否能认真的看下去呢?没关系,这时你是否可以请出Cursor,只要你“开口”,Cursor都答应你,满足你的要求。
三年后,世界上最流行的编程语言是什么?大概率,不会是Python,不是JavaScript,而是英语。而最近很火的一个AI编程软件就十分的出圈--Cursor,它在自然语言上有着极高的处理能力。之前特斯拉的 AI 总监- Andrej Karpathy,他在 Twitter 说过:最热门的新编程语言是English(自然语言)。
最近,他又连发几条推文夸赞 Cursor,说 Cursor 的体验已经碾压式的超过了 GitHub Copilot。甚至有用户评论说:Cursor 是目前最接近于为程序员提供脑机接口编程体验的产品,它能够让程序员以思考的速度去编程。
总结
Cursor 在全球市场上面对的竞争对手是 GitHub Copilot。GitHub Copilot 早在 2021 年时就已经发布,并且团队规模也远超 Cursor。去年三月,Cursor 火了一小段时间,但新鲜劲过去后,很快大家觉得它没戏,当时 GitHub Copilot 无论是在模型能力,还是功能的全面性上,都明显优于 Cursor。Cursor 这一次的出圈,让我再次意识到,创业公司永远是有机会的。重要的永远是你在产品上的理念是什么,你的创新是什么。当我想到 AI 编程,通常会想到 AI 驱动的自动补全功能。所以Cursor在专注于自动补全之后的功能,比如查找和修复错误以及代码库问答,并且取得了用户体验上的突破。
原创文章,未经授权禁止转载。详情见转载须知。2024-09-29
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。