
在当今VC们殚精竭虑追逐的年轻AI初创公司中,GPTZero在成立的第一年半就已经实现盈利,创造了数百万美元的收入。由24岁的Edward Tian和26岁的Alex Cui创立,他们自高中起就是朋友,GPTZero提供了一款帮助识别内容是否为AI生成的检测工具。
创始人们选择接受由Footwork联合创始人Nikhil Basu Trivedi领投的一轮1000万美元的“先发制人”A轮融资,公司团队向TechCrunch独自透露了这一消息。(“先发制人”是VC术语,指投资者在创始人试图筹资前抢到交易。)
对于Basu Trivedi来说,这是一笔非常成功的交易。自Tian于2022年12月推出初始版本的Web应用以来,GPTZero便备受顶级VC公司的关注,3万人迅速涌入使用,导致其基于Streamlit的网站崩溃。(Streamlit的联合创始人Adrien Treuille在售给Snowflake公司以8亿美元后成为天使投资者,Tian表示。)公司于2023年1月正式推出。
在过去的一年里,随着客户群体的增长,年轻创始人们称,他们每周接到4到5个VC的电话。
创始人们告诉TechCrunch,GPTZero在过去六个月里的年度重复购买率增长了500%,其用户群在过去12个月内从100万增长到400万。从某些指标来看,这使其成为了今年增长最快的消费类应用之一。
他们表示,公司在过去几个月里一直盈利,银行账户里的资金比公司的整个生命周期所筹款项还要多。具体数字是:在350万美元的种子轮融资和新的1000万美元之间共计超过1300万美元。
增长仍在继续。Basu Trivedi表示,用户和收入自1月份以来“翻了一番以上,甚至可能翻了三番”。虽然他们没有就估值发表评论,但根据典型的A轮融资额的20%来分析,交易价值公司大约在5000万美元前评估。该轮投资的其他投资者包括以教育为重点(并由女性领导)的Reach Capital;Jack Altman的Alt Capital;领导GPTZero的种子轮融资的Uncork Capital;以及Neo(Ali Partovi的基金)。
VC是如何赢得这笔交易的
普林斯顿大学的校友Basu Trivedi通过长期的游戏赢得了这笔交易的领先地位。他在2022年与Tian见面,在GPTZero疯狂之前,期间是一年一度的普林斯顿学生访问硅谷公司的活动。Basu Trivedi总是带这个团体去斯坦福盘路行。
Tian在攻读计算机科学、自然语言处理和新闻学的同时开发了GPTZero。在BBC和后来在《纽约时报》实习期间,他编写了帮助记者识别AI生成内容的代码。
在他的初始Web应用获得疯狂反应后,Tian联系他的好友Cui寻求帮助。Cui拥有多伦多大学的机器学习硕士学位,并中途退出博士学位课程成为联合创始人。
在两人将应用程序重写成当前独立平台并达到约150万用户后,他们筹集了350万美元种子资金。这主要来自像汤姆·格洛塞(前路透社CEO)、卡内基梅隆大学教授兼苹果AI研究前任主管(在他将他的初创公司Perceptual Machines卖给苹果后)的Russ Salakhutdinov,以及CNN的CEO兼前纽约时报CEO Mark Thompson等天使投资者。
Basu Trivedi看到了GPTZero如何获得媒体报道和令人印象深刻的天使投资者,并听到了有关VC传闻的风声。作为曾支持Canva、ClassDojo和Frame.io等公司的种子投资者,他知道看到一家热门公司的标志。
他于2023年1月给Tian发了条短信打个招呼。他通过他在快速增长公司(如Canva)的产品和运营经验,以及他的基金联合创始人Mike Smith(前Stitch Fix和Walmart COO)的背景,来吸引创始人。
“产品和运营经验丰富的投资者是我们这两位20多岁创始人最需要的,特别是在我们正在学习如何打造一家大公司的过程中”,Tian说。
为了证明这一点,在他们完成融资之后不久,Footwork组织了一个与AI领袖举办的网络活动,包括Basu Trivedi的大学同学Jack Altman,他加入了A轮,并且是OpenAI的Sam Altman的兄弟,以及英伟达创始人兼CEO黄仁勋。
“大数据优势”
GPTZero远非唯一一家致力于识别AI生成内容的公司。其他公司还包括AI Writing Check、Copyleaks、GPT Radar、CatchGPT和Originality.ai。
研究人员发现,AI检测行业中许多公司的准确性糟糕。甚至OpenAI,由于AI行业的偏执压力,于2023年初推出了自己的AI检测器,大约7个月后(2023年7月)关闭了该工具,因为其工作效果较差广受批评。
有趣的是,当TechCrunch的Kyle Wiggers进行了自己对这些工具的实验时,除了GPTZero外,所有工具都不及格。
GPTZero自然有自己的基准,尤其是通过与宾夕法尼亚州研究人员的合作,帮助他们证明其技术运行良好,尽管该行业的整体声誉不佳。
Cui表示,GPTZero更准确是因为它具有更多的数据,并且使用了最先进的开源工具构建自己的LLM模型,他们不会透露。
“我们有大数据优势。我们拥有数百万例人类与AI的文本示例,” Cui说。“我们还结合了一些最佳的模型和深度学习技术。我们实际上正在使用语言模型来检测语言模型。”
尽管这家创业公司最为人熟知的是帮助教师检测AI生成的学生作业(去年10月,GPTZero与美国教师联合会达成协议),但其客户群体已经扩大。现在,客户包括政府采购机构、撰写拨款组织、招聘经理,以及尤其有趣的是AI训练数据标记者们。
原来,使用AI生成的数据进行AI训练“会导致模型崩溃”,Tian说,因为利用虚构实例来教授模型并不是让它在真实世界中运行的最佳方式。
年轻的创始人们有着更宏大的长期愿景。他们希望创建一个新的、独立的网络层,实现责任追踪,确保人类和AI内容得到适当归因。
为此,该团队目前正在研发AI幻觉检测。幻觉,即AI将AI生成的虚构作为事实呈现出来,是GenAI行业的大忌。公司为解决这个问题迈出的第一步是推出了一款新的免费AI文本版权检查工具,用于LLM训练数据集。这将帮助他们为更广泛的幻觉检测生成训练数据。
“我们只是试图避免整个互联网是由AI生成的内容构成的世界,”Tian说。“一个每个人都使用AI的互联网不会保留人们继续贡献创造性和原创内容的机会。”