Ali Ghodsi

Last Updated2026-06-12
Web Sources21
Podcast Sources6
Part 01

摘要

Ali Ghodsi(1978 年生于伊朗德黑兰)是 Databricks 的联合创始人兼 CEO——这家公司是把 UC Berkeley AMPLab 的开源研究项目 Apache Spark 商业化的企业,到 2025 年末已成为史上估值最高的私有科技公司之一(2025 年 12 月 Series L 融资 $4B、估值约 $134B,年收入 run-rate 超 $5.4B、同比增长 65%+)。他的轨迹横跨三块大陆和三种身份:德黑兰出生的医生之子 → 瑞典难民区的"局外人" → 学术研究者(KTH 分布式计算博士、Berkeley 兼职教授)→ 全球最大数据 AI 公司的 CEO

他不是 Spark 的发明人(那是 Matei Zaharia),也不是 Databricks 的第一任 CEO(那是 Ion Stoica),更自称是七位联合创始人里"最不情愿、最没买账"创业的那一个。但正是这个"reluctant co-founder",在 2016 年从学术研究阶段接手公司、把它从一个"managed Spark 服务"重新定义成"a data company",押注 lakehouse(湖仓一体)架构、用 $1.3B 收购 MosaicML 完成生成式 AI 转向、并在 2021–2025 年用一系列史诗级私募融资把公司估值从 $28B 推到 $134B。

他的核心信念可以浓缩成几句反复出现的语录。"We literally wanted to give it away and no one would take it."(关于 Databricks 为什么要成立公司——他们本想免费送出软件,没人肯要。)"99% of the effort is in front of us, not behind us."(他对联合创始人股权与信任的核心框架。)"When you start your company, the culture of your company is more or less the personality of the CEO. Nothing else."(他对组织文化的递归式定义。)"To create a successful company, you have to bet on something that's non-consensus at the time and you have to be right about it."(他对 AI、云、开源三个反共识赌注的总结。)"Humans are the longest pole in the tent."(他对 AI 的清醒判断——再强的能力没人用都是零。)

他也罕见地把"局外人"经历当作可公开讨论的人生引擎——"Being an outsider in Sweden gave me the drive to succeed"——并把这种"truth-seeking"(求真、有话直说、不做 rosy executive presence)写进了 Databricks 的官方文化原则。

Part 02

一、生平时间线

第一章:德黑兰出生与逃离(1978–~1984)

Ali Ghodsi 1978 年出生于伊朗德黑兰。父母都是医生,家境优渥,住在德黑兰一个有景观的山坡富人区。他在 Silicon Valley Nordic Beat 的专访 [04] 里把这一点和湾区做了类比:

"We lived on a hill, and just like here in the Bay Area, all the 'hills' neighborhoods with views were the nicer ones."
"我们住在一座山坡上——就像这里湾区一样,所有带景观的'山上'社区都是更好的那种。"
Silicon Valley Nordic Beat

但这段优渥的童年在两伊战争中被打断。大约 5 岁时,伊拉克空袭德黑兰,他对那一夜有清晰记忆:

"We kids had to crawl under the tables. One night, it felt like our house was hit—the windows shattered, but it was a neighboring house that was bombed to the ground."
"我们这些孩子得钻到桌子底下。有一夜,感觉我们家被击中了——窗户都碎了,但其实是隔壁那栋房子被炸平了。"
Silicon Valley Nordic Beat

家庭决定逃离伊朗。他们最初想去美国——瑞典甚至不是第一选择:

"Sweden wasn't even third, but we had a relative there."
"瑞典连第三选择都算不上,但我们在那里有个亲戚。"
Silicon Valley Nordic Beat

第二章:瑞典难民岁月与"局外人"驱动力(~1984–2002)

阶层的跌落

在瑞典,一家人最初辗转于斯德哥尔摩大学的学生宿舍,多次被驱逐,最后落脚在斯德哥尔摩郊区 Bagarmossen。Ghodsi 对这段"阶层跌落"的描述极其直白:

"We were evicted several times, once after I accidentally knocked over the TV in the communal living room."
"我们被驱逐过好几次,有一次是因为我不小心打翻了公共起居室的电视。"
Silicon Valley Nordic Beat
"If we were upper class in Iran, we were definitely lower class in Sweden—it was welfare and all that."
"如果说我们在伊朗是上层阶级,那在瑞典我们绝对是下层阶级——靠救济金过活,诸如此类。"
Silicon Valley Nordic Beat

"Us and Them"——局外人身份成为终身引擎

这段经历塑造了他人生最重要的一个心理结构。他把它叫做 "us and them"——而且后来反复把它当作自己事业驱动力的根源公开讲述:

"I vividly remember the sense of being an outsider. It was always 'us and them."
"我清楚地记得那种局外人的感觉。永远是'我们和他们'。"
Silicon Valley Nordic Beat
"Of course, it's a motivator. You feel like you have to prove yourself, and you work much harder."
"当然,它是一种驱动力。你觉得你必须证明自己,你工作得拼命得多。"
Silicon Valley Nordic Beat

他甚至把自己和瑞典本地同事做了一个意味深长的对比:

"My Swedish colleagues were more balanced; they didn't have anything to prove."
"我那些瑞典同事更平衡;他们没有什么需要证明的。"
Silicon Valley Nordic Beat

这条"局外人 → 必须证明自己 → 拼命工作"的链条,是理解他后来在 Logan Bartlett Show 上说"招有 chip on their shoulder 的人"(招肩上带着一股不服气的人)的根。

值得注意的是,他对瑞典并非只有怨怼——他也公开表达过感激,认为瑞典的福利制度给了一个难民家庭"每个人都应得的平均水平",让他得以上大学、读博士。这是一个被他同时保留的双重判断:福利制度的恩惠 + 局外人身份的刺痛。

那台坏了磁带驱动器的 Commodore 64

10 岁那年,他得到一台二手 Commodore 64——磁带驱动器是坏的。为了能玩游戏,他不得不学会编程:

"I became a nerd. If you ask anyone who knew me back then, they'd remember me as the kid who was always in front of the computer."
"我变成了一个 nerd。你问任何一个那时候认识我的人,他们都会记得我是那个永远坐在电脑前的孩子。"
Silicon Valley Nordic Beat

他对学校的态度则相反——"我不喜欢学校,缺勤率很高"。

关键决策:拒掉 Electronic Arts、改读"计算机 + 商科"(~1996–2003)

  • 背景:少年 Ghodsi 梦想做游戏开发,并真的拿到了 Electronic Arts 的工作 offer。但父母——两位医生——希望他成为医生或律师,拒绝了这个 offer。
  • 关键假设:他自己无法想象当医生,也不喜欢法律。计算机科学是他真正的兴趣。
  • 决策:他申请去 Mid Sweden University(中瑞典大学,Sundsvall 校区)读计算机科学。1997 年拿到电子与计算机工程 BSE,2002 年拿到计算机工程 MSc。
  • 转折:一个室友的一句话把他推向了商科。Ghodsi 在 Nordic Beat 上复述了这句激将:
"Then he said, 'Ali, you study programming, but when you start working at a company, I'll be your boss running the company.' No way, thought Ghodsi."
"然后他说:'Ali,你学编程,但等你进公司工作时,我会是你的老板、是经营公司的人。'门都没有,Ghodsi 心想。"
Silicon Valley Nordic Beat

于是他在 2003 年又拿了一个 MBA(物流与营销方向)。这个"技术 + 商科"的双重训练后来成为他与许多纯技术创始人不同的地方——他自己在 Unusual Ventures 的访谈 [17] 里反复强调技术创始人"系统性低估营销"。

第三章:学术之路——KTH、Peerialism、博士(2003–2009)

2006 年,Ghodsi 在 KTH 皇家理工学院(斯德哥尔摩)拿到分布式计算博士学位,导师是 Seif Haridi,博士论文是关于分布式哈希表("Distributed k-ary System: Algorithms for Distributed Hash Tables")。

同在 2006 年,他与人共同创立了 Peerialism AB——一家斯德哥尔摩的点对点(P2P)数据传输创业公司。这是他的第一次创业——一次在档案叙事里很少被强调、但很重要的预演:他不是一个从未碰过公司的纯学者。

2008–2009 年,他在 KTH 担任助理教授,加入 SICS 的分布式系统研究组。这一时期他还共同发明了 Dominant Resource Fairness(多资源公平调度模型)——一个后来影响了 Hadoop YARN 和 Apache Mesos 调度的概念。

注:关于 KTH 助理教授任期,Wikipedia [01] 记为 2008–2009,部分来源延伸到 2013(与他后来在 Berkeley 做访问学者的时期重叠)。本档案以 2008–2009 为准。

第四章:Berkeley AMPLab 与 Apache Spark(2009–2013)

AMPLab:一个"为真实世界影响力优化"的实验室

2009 年,Ghodsi 作为访问学者加入 UC Berkeley,进入新成立的 AMPLab(Algorithms, Machines, and People Laboratory)。AMPLab 由 DARPA 和 NSF 出资 $40M 成立 [05]——它被刻意设计成与传统学术实验室不同:"optimizing for real-world impact rather than purely publishable papers"(为真实世界的影响力优化,而不是纯粹为了可发表的论文)。

在 AMPLab,Ghodsi 与 Ion Stoica、Scott Shenker、Michael Franklin、Matei Zaharia 等人合作。他后来六位联合创始人全部是在这里相遇的——这一点他在 Fortune 2025 的访谈 [07] 里特意拿来论证"高等教育在 AI 时代依然有价值"。

Spark 为什么存在:MapReduce 的根本缺陷

Apache Spark 的发明人是博士生 Matei Zaharia。他在 ~2009 年识别出 Hadoop MapReduce 的一个根本性低效 [05]:

机器学习算法是迭代的——需要对数据反复多次扫描。但 MapReduce 每一轮迭代都强制读写磁盘,让一个"本该几分钟"的任务变成"几个小时"。Spark(2010 年开源)通过 RDD(弹性分布式数据集)把数据保留在内存里、用 lineage(血缘)追踪而非复制存储来解决这个问题:

"Spark ran iterative machine learning algorithms up to 100 times faster than Hadoop MapReduce."
"Spark 跑迭代式机器学习算法比 Hadoop MapReduce 快达 100 倍。"
Stacksync, 转述 Databricks 早期数据

2013 年,Spark 被捐赠给 Apache 软件基金会。

第五章:Databricks 的诞生——"没人肯要免费软件"(2013)

关键决策:为什么这群学者要成立一家公司

这是整个 Databricks 故事里最反直觉、也最重要的一个决策——这七位学者从一开始并不想创业

  • 背景:AMPLab 的团队做出了 Spark,受 Google 和 Facebook 在大规模 ML 上的做法启发。他们把软件放上几个网页,希望世界来下载使用。结果几乎无人问津。
  • Ghodsi 在 The Stack 的访谈 [15] 里把这段"失败"讲得极其坦白:
"We built the software, put it on a few web pages and said: 'Hey download this!' No one downloaded it."
"我们做出了软件,放上几个网页说:'嘿来下载这个!'没有人下载。"
The Stack
"They all told us 'no: this is academic mumbo-jumbo. We need enterprise software.' We literally wanted to give it away and no one would take it."
"他们都对我们说'不:这是学术界的胡言乱语,我们需要企业级软件。'我们真的想把它免费送出去——没有人肯要。"
The Stack
  • 关键假设:唯一能让 Spark 被企业采用的方式,是把它打包成企业级产品——而这需要一个商业实体。换句话说,成立公司不是为了赚钱,是为了让开源项目被采用
  • 决策:2013 年 6 月,七位 AMPLab 学者成立 Databricks

Ben Horowitz:从"要 $20 万"到"给你 $1400 万"

融资环节有一个被反复引用的故事。团队最初只想要一笔很小的钱"安静地写一年代码":

"This being Silicon Valley the venture capitalist Ben Horowitz happened to be close, so we asked him for $200,000 to go away, code for a year and build this thing. He offered $14 million."
"因为这是硅谷,风险投资人 Ben Horowitz 正好就在附近,所以我们找他要 $20 万,想躲起来写一年代码、把这东西做出来。他给了我们 $1400 万。"
The Stack

Ghodsi 在 Logan Bartlett Show [2348741] 上补充了 Horowitz 当时如何重塑团队野心的细节——Horowitz 告诉他们一家围绕这项技术的公司"可能值 $100 亿",并建议把工程师薪酬提到行业 90 分位以吸引顶尖人才。Andreessen Horowitz 领投了 Databricks 的 Series A——$13.9M

Ghodsi 后来还讲过一个 Horowitz 帮他重新定义"终局野心"的对话——团队原本以为这是一家可能 $1.5–2.5 亿退出的公司,Horowitz 让他把目标改成"成为 FANG 之外的下一个巨头":

"He said, huh, so FANG is the problem? And I said, yeah, FANG is the problem. And he said, okay, so you just need to add yourself to that list. It needs to be FANGDB."
"他说,哈,所以 FANG 是问题所在?我说,对,FANG 是问题。他说,好,那你只需要把自己加进那个列表。它得是 FANGDB。"
Logan Bartlett Show, 2024

早期商业模式的局限

最初的产品是 managed Spark-as-a-service——Databricks 替客户跑计算、处理 DevOps。这解决了 2013 年的一个真实痛点(自己跑 Spark 需要"严肃的工程肌肉")。但 Ghodsi 在 Stanford ETL [1215036] 上把这段早期增长停滞坦诚地复盘为第一个 pivot:产品驱动增长(PLG)停滞了,他们"刻意做了相反的事"——转向企业级销售、大量招销售人员。

他在 Unusual Ventures [17] 上把这段早期决策称为自己最大的错误

"Not building a complete SaaS offering from day one... Most shortcuts don't pay off."
"没有从第一天就做一个完整的 SaaS 产品……大多数捷径都不划算。"
Unusual Ventures

第六章:从 VP 到 CEO(2016)

关键决策:Ion Stoica 交棒、Ghodsi 接任 CEO

  • 背景:2016 年初的 Databricks 已经在 2015 年 6 月产品 GA 之后积累了 200+ 付费客户、培训了 20,000+ Spark 开发者 [06]。公司正从"研究驱动阶段"转向"企业销售/客户获取阶段"。
  • 关键假设:(1) 第一任 CEO Ion Stoica 是 Berkeley 的终身教授——大学只批准有限的离职期;(2) 下一阶段需要的是一个运营者,而不是研究领袖;(3) Ghodsi 作为 VP 工程与产品、又有 MBA 背景、又被难民经历磨出了运营韧性,是合适人选。
  • 决策:2016 年 1 月 11 日,Ion Stoica 转任执行董事长,Ali Ghodsi 出任 CEO

Stoica 在官方公告 [06] 里的说法点明了这次交棒的本质——"inflection point"(拐点):

"Databricks is at an inflection point where the pace of innovation coming from the community positions us for tremendous growth and opportunity in 2016. Ali is poised to enable both Databricks and Spark to seek widespread enterprise adoption, momentum, and customer acquisition."
"Databricks 正处在一个拐点——来自社区的创新速度让我们在 2016 年迎来巨大的增长和机会。Ali 已经准备好让 Databricks 和 Spark 去争取广泛的企业采用、势头和客户获取。"
Ion Stoica, Databricks 官方公告, 2016-01-11

"Databricks 不是一家 Spark 公司,是一家数据公司"

接任 CEO 后,Ghodsi 做的最重要的事是一次战略性重新定义。Stacksync [05] 把这次重新定义概括为:

"Databricks was not a Spark company. Databricks was a data company. Spark was the engine—but engines don't win markets. Platforms do."
"Databricks 不是一家 Spark 公司。Databricks 是一家数据公司。Spark 是引擎——但引擎赢不了市场。平台才能。"
Stacksync, 概括 Ghodsi 接任 CEO 后的重新定义

这次"引擎 vs 平台"的区分,直接通向了后面的 Delta Lake(2017)和 lakehouse 架构(2020)。

那次彻夜的 Petabyte 排序世界纪录

2014 年(在 Ghodsi 成为 CEO 之前),他和联合创始人做过一件后来被他视为关键营销突破的事。Ghodsi 在 Stanford ETL [1215036] 上详述:团队连续熬了一整周,用总内存不到一个 petabyte 的机器,在约 22 分钟内排序了一个超过 1 petabyte 的数据集,创下世界纪录。

这件事的目的非常具体——杀掉一个 FUD(恐惧、不确定、怀疑):当时竞争对手散布"Spark 只在内存充足时才有用"。这个世界纪录证明了 Spark 在内存不足时同样能跑,把竞争对手从敌对态度逆转成"拥抱 Spark"。这是理解 Ghodsi"营销作为战略武器"思维的关键案例——他在 Unusual Ventures [17] 上说"once you get that brand recognition, everything in life becomes easier"。

第七章:Lakehouse 豪赌与 Snowflake 之争(2017–2022)

关键决策:押注 lakehouse——合并两个竞争对手一直分开的产品品类

  • 背景:2017–2020 年,企业数据架构是"两层式"的——一个 data lake(数据湖,便宜、能存任意类型数据,但不支持事务、不保证数据质量),加上若干 data warehouse(数据仓库,支持 SQL/BI、有事务,但对非结构化数据不友好、成本高)。数据专业人员"不可避免地需要在不同系统之间移动或复制数据" [08]。
  • 关键假设:(1) 这两个品类可以合并——把数据仓库的数据结构和管理特性直接实现在便宜的云存储 + 开放格式之上;(2) AI/ML 需要的恰恰是数据仓库处理不了的非结构化数据(视频、音频、文本)——"AI tilts the answer decisively toward the lakehouse"(AI 让答案决定性地倒向 lakehouse)。
  • 决策:2017 年起开发 Delta Lake,2019 年开源,2020 年 1 月正式发表 "What Is a Data Lakehouse?" 博文 [08] 把"湖仓一体"作为公司战略命名并公开。

这次押注的核心是把竞争对手 Snowflake 一直分开卖的两个东西合并——并且用开放格式而非专有格式来做。

Databricks vs Snowflake:两种架构哲学的战争

Foundation Capital 的分析 [09] 把这场竞争概括为"a fight for the future of enterprise AI"(一场关于企业 AI 未来的战争),而不只是市场份额之争——两家公司甚至刻意把年度大会安排在同一天,逼迫共同客户选边站

两种哲学的根本分裂:

  • Databricks(自下而上、开源驱动、ML 优先):源于 Apache Spark,先服务数据科学家和 ML 工程师,从一开始就对 AI 友好。
  • Snowflake(自上而下、SQL 中心):围绕 SQL 构建、与 BI 紧密集成,服务数据分析师和 IT,"slower to adapt to the rising importance of AI"。

数据格式之战的回合 [09]:Snowflake 开源 Polaris(其 Apache Iceberg 目录)→ Databricks 收购 Tabular(Iceberg 项目创始人做的托管方案,刻意安排在 Snowflake 大会期间公布)→ 一周后 Databricks 在自己的 summit 上开源 Unity Catalog

与超大规模云厂商的"亦敌亦友"

Databricks 的一个独特战略难题是:它既建立在 AWS、Azure、GCP 之上(这些是合作伙伴),又与它们竞争。Ghodsi 在 SiliconANGLE [14] 上讲了这段:

"When I swiped my personal credit card on AWS, some of my co-founders did the same, and we started building."
"我刷自己的个人信用卡开了 AWS 账户,我的一些联合创始人也这么做,然后我们就开始搭建了。"
SiliconANGLE, 2022

到 ~2017 年,AWS 才注意到"一家年收入约 $1 亿的公司突然出现在他们雷达上"。Ghodsi 的应对是多云策略——70%+ 的 Databricks 客户使用多个云。他的"Sky Above the Clouds"论点是:客户最终会要求"任何我用的服务,在所有云上都得一模一样地工作",这会迫使云厂商把竞争从专有服务转向基础设施层。

第八章:MosaicML 与生成式 AI 转向(2023–2024)

关键决策:$1.3B 收购 MosaicML

  • 背景:2022 年底 ChatGPT 引爆生成式 AI。Databricks 的 lakehouse 已经是"AI 友好"的数据底座,但它还不能让企业训练自己的 LLM
  • 关键假设:(1) 企业不想把自己的私有数据交给 OpenAI/Anthropic——他们想拥有自己的模型和 IP;(2) 企业数据是客户打败竞争对手的"kryptonite"(氪石/秘密武器);(3) lakehouse 应该成为"the best place to build generative AI and LLMs"。
  • 决策:2023 年 6 月 26 日宣布以约 $1.3B 收购 MosaicML(创始人 Naveen Rao),7 月 19 日完成交割。

Ghodsi 在收购公告 [10] 里的说法:

"Databricks and MosaicML have an incredible opportunity to democratize AI and make the Lakehouse the best place to build generative AI and LLMs."
"Databricks 和 MosaicML 有一个不可思议的机会——把 AI 民主化,让 Lakehouse 成为构建生成式 AI 和 LLM 的最佳场所。"
Ali Ghodsi, MosaicML 收购公告, 2023-06-26

他在 a16z Live [153965] 上把企业数据的战略意义说得更直白:

"Many leaders, especially CEOs, are now realizing that their data could be their kryptonite to beat the competition."
"很多领导者,尤其是 CEO,现在意识到他们的数据可能是他们打败竞争对手的氪石。"
a16z Live, 2023

DBRX:自己下场做开源模型

2024 年 3 月 27 日,Databricks 发布了自己的开源 LLM DBRX——一个 mixture-of-experts 架构的模型。Ghodsi 在发布公告 [13] 里给了三个理由,其中第二个揭示了 Databricks 的"data intelligence"赌注:

"It beats GPT-3.5 on most benchmarks, which should accelerate the trend we're seeing across our customer base as organizations replace proprietary models with open source models."
"它在大多数基准上击败 GPT-3.5——这应该会加速我们在客户群里看到的一个趋势:组织正在用开源模型替换专有模型。"
Ali Ghodsi, DBRX 发布公告, 2024

"Compound AI Systems"——反对"训一个超大模型"

Ghodsi 在 Logan Bartlett Show [2348741] 和 a16z Live [153965] 上都反复表达了一个反共识的产品判断:未来不是一个巨型模型,而是 compound AI systems(复合 AI 系统)——多个专门化组件的组合,每个组件的贡献都可被评估、被调试。

他用 Databricks 自己的使用数据来支撑这个判断:

"Customers want to take the big models, distill the smallest possible that can get good enough quality and just use that because that saves them money. And actually in aggregate, we make more money on that."
"客户想拿大模型、蒸馏出能达到'足够好'质量的最小模型、然后就用那个,因为这省他们钱。而事实上,加总起来我们在这上面赚得更多。"
Logan Bartlett Show, 2024

他对"暴力堆算力"的可持续性也很怀疑:

"Over the last 11 years, we've had a hundred million times improvement in compute that we've thrown at the problem. We're not going to be able to get the same over the next few years."
"过去 11 年里,我们投入到这个问题上的算力提升了一亿倍。接下来几年我们不可能再获得同样的提升。"
Logan Bartlett Show, 2024

而他对 AI 最清醒、最常被引用的一句话,是关于"采用"而非"能力"才是真正的瓶颈:

"Humans are the longest pole in the tent here. If no human uses any of this stuff, it's absolutely useless. You can't even come up with that super AGI thing. If nobody's using it, it doesn't matter."
"人类是这顶帐篷里最长的那根杆子。如果没有人用这些东西,它就绝对毫无用处。哪怕你搞出那个超级 AGI——如果没人用,它也没意义。"
Logan Bartlett Show, 2024

第九章:超大规模融资、保持私有、万亿愿景(2024–现今)

关键决策:用史诗级私募融资替代 IPO

  • 背景:2024 年是美国大选年,市场对利率、通胀充满不确定。同时 Databricks 的早期员工需要流动性(套现)。
  • 关键假设:(1) "it's dumb to IPO this year"(今年上市是愚蠢的);(2) 员工流动性可以直接用一轮巨额私募解决,不必上市;(3) 保持私有本身带来了竞争优势。
  • 决策:2024 年 12 月,Databricks 完成 Series J——$10B 融资、估值 $62B(2024 年最大的 VC 轮),加一笔约 $5.25B 信贷额度,专门用于员工流动性和相关税务。

Ghodsi 在 TechCrunch 的访谈 [18] 里把理由讲得很直白:

"This year was an election year. We wanted to get some stability — people are worried about interest rates, inflation. So we said look, it's dumb to IPO this year, so we're definitely going to wait."
"今年是大选年。我们想要一些稳定性——人们担心利率、通胀。所以我们说,看,今年上市是愚蠢的,我们肯定要等。"
TechCrunch, 2024-12

他对当时的 AI 估值环境也毫不留情:

"I mean, it's peak AI bubble. It doesn't take a genius to know that a company with five people which has no product, no innovation, no IP — just recent grads — [is not] worth hundreds of millions, sometimes billions."
"我是说,这是 AI 泡沫的顶峰。不需要天才也知道,一家五个人、没产品、没创新、没 IP——只是刚毕业的学生——的公司,不值几亿、有时甚至几十亿美元。"
TechCrunch, 2024-12

他在 Stanford ETL [1215036] 上把"保持私有"提升为一个战略原则——"asymmetric moves"(非对称行动)

"I think being private lets you make asymmetric moves to win in the market."
"我认为保持私有让你能做出非对称的行动来赢得市场。"
Stanford ETL, 2024

具体而言:保持私有让 Databricks 能做战略性降价、做收购、把人派到近期 ROI 很低的国家——这些都是季度财报压力下做不了的动作。他的对照组是那些在 2021 年泡沫期 IPO 的同行——他们在 2022 年被迫削减成本,而保持私有的 Databricks 继续招了几千人。

持续的融资阶梯与万亿愿景

  • 2025 年 9 月:Series K——$1B 融资,估值超 $100B
  • 2025 年 12 月:Series L——$4B 融资,估值约 $134B
  • 2026 年 1 月:再获 JPMorgan 与私募信贷机构 $1.8B 债务融资;自由现金流为正(The Next Web 报道)。
  • 2026 年 2 月:年收入 run-rate 越过 $5.4B,同比增长 65%+;有报道称其考虑以 ~$175B 估值 IPO(Ghodsi 本人未确认)。
  • 2026 年 6 月:Ghodsi 在 Bloomberg 访谈中明确:2026 年不上市(见下)。

Ghodsi 在 Fortune 2025 年 12 月的访谈 [19] 里给出了通往 $1 万亿估值的"三重赌注":

  1. Lakebase——一个基于 Postgres、为 AI agent 优化的事务型(OLTP)数据库;切入"40 年没变过"的企业数据库市场。
  2. AI 代码生成——"80% 以上在 Databricks 上启动的数据库不是人启动的,而是 AI agent 启动的"。
  3. vibe-coded apps——建立在 Lakebase + agents 之上的应用。

而他对企业 AI 护城河的判断回到了"数据"这个原点:

"It's a commodity now to have AI that has general knowledge, but it's very elusive to get AI that really works and understands that proprietary data."
"拥有具备通用知识的 AI 现在已经是大宗商品了,但要得到真正能工作、真正理解那些专有数据的 AI——这非常难以捉摸。"
Fortune, 2025-12

2026 年中:"不是今年"第三次上演 + "context problem" 论点

IPO:又一次推迟。 2026 年初市场普遍预期 Databricks 年内挂牌,但 6 月 4 日 Ghodsi 在 Bloomberg 访谈中给出相反答案。背景(报道口径):SpaceX、Anthropic、OpenAI 三大超级 IPO 拟在 2026 年合计从公开市场吸走超 $200B,挤占银行、分析师与媒体注意力:

"We will be a public company. I just think this is a terrible year to go public."
"我们会成为一家上市公司。我只是认为今年是上市的糟糕年份。"
Bloomberg, 2026-06-04(转引自 The Next Web)
"If I wanted to have a crazy, crazy valuation, we would have gone public in the last 12 months. We just want to have a fair valuation that we can continue growing into."
"如果我想要一个疯狂至极的估值,我们过去 12 个月里早就上市了。我们只想要一个我们能持续成长进去的公平估值。"
Bloomberg, 2026-06-04(转引自 The Next Web)

上市的最终理由依然不是融资,而是员工——"We want to create a market transaction mechanism for our employees."("我们想为员工创造一个市场化的交易机制。")

[推断] 这是他第三次用几乎同一套逻辑推迟 IPO(2023 "we will go public when the time is right" → 2024 "it's dumb to IPO this year" → 2026 "a terrible year to go public")。模式一致:把"何时上市"当作可反复行权的期权——用巨额私募与债务解决员工流动性这个唯一的硬需求,把上市时点的选择权本身经营成"asymmetric moves"的一部分。

AI 论点的 2026 压缩版。 2026 年 5–6 月,他把 2024 年的 "compound AI systems"、2025 年的"通用知识已是大宗商品"进一步压缩成一句口号式 thesis,并在 Bloomberg Technology 活动上宣称 AGI 实际上已经到来(现场仅约 10% 观众起初同意;报道转述):

"AI doesn't have an intelligence problem. It has a context problem."
"AI 没有智能问题。它有的是 context 问题。"
CNBC(Jim Cramer 访谈),2026-05-20
"We don't need AI to get smarter. It just needs to be given context."
"我们不需要 AI 变得更聪明。它只需要被给予 context。"
Bloomberg Technology 活动,2026-06

[推断] 这句口号是 Databricks 商业利益与他个人技术判断的重合点:若瓶颈是 context 而非模型智能,价值就从模型层移到数据平台层——正是 Databricks 的位置。但它与他 2024 年的 "humans are the longest pole in the tent"、"distill the smallest possible model" 一脉相承,是同一论点的演化而非临时的营销话术。

Part 03

二、深度洞察

关于创业:grit 与"局外人"驱动力

Ghodsi 把创业成功的第一要素归结为 grit(坚毅)——而且明确地把它和"放弃太早"对立起来:

"Grit. Most successful entrepreneurs failed for a long time until they finally succeeded. I've seen many people throw in the towel too early."
"坚毅。大多数成功的创业者在最终成功之前失败了很长时间。我见过很多人认输得太早。"
Unusual Ventures

这条"grit"信念的根,是第二章里那条"局外人 → 必须证明自己"的链条。他把这种特质制度化进了招聘——在 Logan Bartlett Show 上他说 Databricks 招"with a chip on their shoulder"的人,并坦白这是一个高压、拼命工作的环境,"不适合所有人"——而对这种期待诚实反而保证了对齐。

关于开源:成功需要"连续两个 home run"

这是 Ghodsi 在 Stanford ETL [1215036] 上对开源商业化最系统的论述——一个残酷的公式:

"The problem with open source is that the perfect formula for succeeding with open source looks as follows. It requires two home runs that happen consecutively."
"开源的问题在于,开源成功的完美公式是这样的:它需要连续打出两个全垒打。"
Stanford ETL, 2024
  • Home run #1:一个能病毒式传播的开源项目。打不出这个,你就等于把自己的 IP 白送给了竞争对手。
  • Home run #2:一个建立在开源之上、客户愿意付钱的专有 10x 增值层。

Databricks 的解法是:在开源 Spark 之上保留一个专有的、快 10x 的引擎——因为有更大分发能力的云厂商会把开源版免费提供。而这个专有层必须是 drop-in 兼容的——"a turbo pack"(涡轮增压包),客户已有的东西插上就能用。

2021 年他在 Invest Like the Best [2185232] 上补上了这个公式的需求侧:企业拥抱开源不是出于理想主义,而是对 1980 年代以来 vendor lock-in 创伤的反应——

"Enterprises prefer open source because it avoids lock-in. When you bet on proprietary vendors, they eventually become complacent because they know you cannot leave."
"企业偏爱开源,因为它避免锁定。当你押注专有厂商时,他们最终会变得自满——因为他们知道你走不掉。"
Invest Like the Best, 2021

在他的叙述里,开源对 Databricks 自己同样是一个 forcing function:客户随时可以走,所以你必须靠真实的创新而非锁定留住他们。

关于产品:vitamin vs painkiller 与 10x

Ghodsi 对"产品从 0 到 1"的核心判断是一个生动的二分:

"You built a vitamin. We all take the vitamin, we're excited when we buy it, but then the next day we forget to take the vitamin."
"你做了一个维生素。我们都买维生素,买的时候很兴奋,但第二天就忘了吃。"
Stanford ETL, 2024

vitamin(维生素)是买的时候兴奋、第二天就忘的东西;painkiller(止痛药)是每次头疼都会用的东西。判断标准不是会议室里的热情,是留存数字

而要真正改变一个市场,他引用 Peter Thiel——你需要 10x 的改进。Databricks 的专有引擎让 Spark 快 10x,这翻译成 10x 更少的机器、10x 的价格优势——然后这个优势"和客户对半分"。

关于组织:culture = CEO 的人格(递归式定义)

这是 Ghodsi 最"有争议"、也最被反复引用的管理观点。他在两期播客 [1215036][5481824] 上都讲了同一个递归式定义:

"When you start your company, the culture of your company is more or less the personality of the CEO. Nothing else."
"当你创办公司时,公司的文化或多或少就是 CEO 的人格。没有别的。"
Ali Ghodsi

而且这个逻辑是分形/递归的——一个部门的文化就是这个部门负责人的人格。他用微软举例:Bill Gates 的微软、Steve Ballmer 的微软、Satya Nadella 的微软是同一家公司下的三种不同文化。

他的方法论是把 CEO 的人格编码成"culture principles"(文化原则)——一份告诉员工"如何在这家公司成功"的 cheat sheet。但他强调一个关键约束:这份编码必须诚实

"When you're codifying those principles, you can lie to yourself and pretend you're someone you're not. That's not going to go well. Write down properly who you really are. Introspect that."
"在编码这些原则时,你可以对自己撒谎、假装你是另一个你不是的人。那不会有好结果。如实地写下你到底是谁。对此做内省。"
Ali Ghodsi

他还引用 Ben Horowitz 的 What You Do Is Who You Are——身份由行动定义,不由言辞或愿望定义。维持文化一致性靠三个闭环动作:按原则提拔、按原则招聘、按原则把人请出去

值得注意的是他在 Logan Bartlett Show 上对 Databricks 文化原则的描述——它们不是墙上那种励志口号

"Our culture principles aren't like the aspirational cool stuff that you'd like to have on the wall. It's literally what worked and didn't work in the past empirically."
"我们的文化原则不是那种你想挂在墙上的、励志的酷东西。它就是字面意义上——过去在经验上什么有效、什么无效。"
Logan Bartlett Show, 2024

文化原则之外,他对"规模化对 CEO 心智的要求"有一个分阶段框架(Invest Like the Best, 2021 [2185232]):早期 PMF 阶段需要 owner 心态——看到问题就亲手解决,哪怕不是你造成的;到了第三阶段,同样的心态反而有害:

"In the early phase, if you see trash in the kitchen, you clean it up. At scale, you don't pick it up; you figure out how it got there and build processes to ensure it never happens again."
"早期阶段,你看到厨房里有垃圾,就把它捡起来。到了规模化阶段,你不再去捡——你要搞清楚它是怎么出现在那里的,并建立流程确保它再也不会出现。"
Invest Like the Best, 2021

同一期访谈里他还说:与其他强 leader 建立信任是 CEO 工作里最耗时、最难的部分——但你无法独自建成一家大而重要的公司。

2021 年 20VC [100401] 上他给这套"流程化"补了三个具体机制:

  1. Lowlights 强制汇报——成功是危险的,高增长会掩盖糟糕的流程。团队来庆祝"碾压了目标"时,他会问 "What is not going well?"("什么进展不顺?")——在一切尚好时逼组织正视裂缝,否则小裂缝会在增长放缓时变成结构性塌方。
  2. GTM 排序反常识——他反对"先招市场负责人讲故事"的常规智慧:先招销售 leader,创始人和 TA 一起见客户、在真实世界里学会怎么卖,然后才招市场负责人把信息系统化。
  3. 财务作为制衡——销售 leader 天然"不计代价冲收入"、会激进扩编烧钱,必须早招财务 leader 做 checks and balances;否则 CEO 只能亲自当支出警察——"一场必输的仗"。

关于联合创始人:99% 的努力在前方

Ghodsi 自称是七位联合创始人里"最不情愿"创业的那一个:"I didn't want to start a company and I was the reluctant, I was the least in of the co-founders."(我不想创业,我是那个最不情愿的、最没买账的联合创始人。)

但他对联合创始人关系给出了一个非常清晰的框架——核心是"信任",以及一个用来化解股权纷争的洞察:

"We're doing this together because we think we're going to create something amazing in front of us. And when we create that amazing thing in front of us, 99% of the effort is in front of us, not behind us."
"我们一起做这件事,是因为我们相信我们将在前方创造出某种了不起的东西。而当我们创造那个了不起的东西时——99% 的努力在前方,不在身后。"
Stanford ETL, 2024

既然 99% 的努力还在前方,那么围绕"过去谁贡献了多少"做向后看的谈判就是不理性的。值得一提的是他的坦诚——他说 Databricks 没有在七位联合创始人之间平分股权,而事后看"他们本应该平分"。

但"向前看"不等于回避冲突。他在 20VC [100401] 上把 conflict-aversion(回避冲突)列为 CEO 的危险特质:他见过公司死于 CEO 不敢请走一位明显不胜任的联合创始人或早期朋友。不做这个决定,本质上是在用公司的存亡换取个人的情感舒适(转述)。

关于决策:non-consensus bets 与场景树

Ghodsi 对"成功公司"的定义是一个关于反共识的论断:

"To create a successful company, you have to bet on something that's non-consensus at the time and you have to be right about it. So for us, it was AI. It was the cloud. It was open source."
"要创造一家成功的公司,你必须押注某个在当时是反共识的东西,而且你必须押对。对我们来说,那就是 AI、云、开源。"
Logan Bartlett Show, 2024

他在 Logan Bartlett Show 上回忆 Databricks 创立时(2009–2013)听到的"明智建议"全是反对:开源 AI 无法变现、预测分析没有市场(相比向后看的 BI)、所有数据都会留在本地——而他们的推理是 "if we didn't build it, no one would"(如果我们不做,没人会做)。

他还有一个关于聚焦的标志性比喻:

"We have a gun and it has one bullet left in it. We're not going to do a thousand things. We have like one bullet left. We better aim it really clearly and we better hit the target."
"我们有一把枪,里面只剩一颗子弹。我们不会做一千件事。我们只剩一颗子弹。我们最好瞄得非常清楚,最好打中目标。"
Logan Bartlett Show, 2024

对于"是否卖掉公司",他给的方法是场景树——把当前增长率复合到三年后;一个真实的收购报价必须打败最坏情况、大概率也要打败中间情况,因为创始人不会用今天的估值卖掉一个一年后能长进更高倍数的公司。(他还给了一条很务实的建议:有 offer 时先别告诉联合创始人——否则会陷入政治。)

场景思维在公司治理层面还有一个制度化版本(20VC, 2021 [100401]):他强迫管理层每年做一次 "sky is falling"(天要塌了)演习——哪怕在增长最快的年份——模拟市场骤停、融资枯竭。这不是悲观主义,而是提前写好 playbook:疫情来袭时 Databricks 不需要恐慌,因为那些 "what if" 早已推演过。他把这种"计算过的乐观 + 深度偏执"的组合直接归因于难民经历:

"Because I experienced both extreme wealth and extreme poverty at a young age, I know that everything can go to zero in a heartbeat."
"因为我在很小的年纪就经历过极端的富有和极端的贫穷,我知道一切都可能在一瞬间归零。"
20VC, 2021

与之配套的是他对直觉的不信任——"I prefer process over intuition every time."("我每一次都宁选流程而非直觉。")他不相信答案会"在睡梦中降临":分析数据、列出标准、过逻辑。唯一的例外是文化契合度——但他连这个也处理成一个 cerebral 的判断(对职场长期"婚姻"可行性的评估),而非 gut feeling。

关于个人:truth-seeking 与"学术失败模式"

Ghodsi 把 Databricks 文化的一条核心原则——truth-seeking——直接追溯到七位创始人的研究背景:

"We're truth-seeking, which comes from the research background. We're very, tell it as it is, be honest about it. That's not common in the industry."
"我们求真——这来自研究背景。我们非常'有什么说什么'、对此诚实。这在业界不常见。"
Ali Ghodsi

但他同时对"学者出身"保持着罕见的自我批判。他在 Stanford ETL 上明确指出一个"学术失败模式"——细节导向、演绎式推理、期待每个人都像研究者一样思考——他说自己必须有意识地训练自己"关掉大脑的那一部分",才能去招非技术岗位(营销、销售)的人。

他对"面试"这个信号本身也极度怀疑:

"I don't believe in interviews. Because I think some people interview well, and they might not be good at all. And some people interview really poorly, but it might be excellent."
"我不相信面试。因为我觉得有些人面试表现很好,但他们可能根本不行。有些人面试表现很差,但可能极其出色。"
Logan Bartlett Show, 2024

他更信任的是 backdoor reference(非正式背景调查)和"这个人过去实际表现如何"的经验证据——以及一条他作为管理者的不可妥协的红线:

"Outright lying. If you lie to me, we're going our separate ways."
"公然撒谎。如果你对我撒谎,我们就分道扬镳。"
Unusual Ventures
Part 04

三、数据来源

网络研究(21 篇)

  1. Ali Ghodsi — Wikipedia — 基础事实时间线
  2. Databricks — Wikipedia — 公司框架、融资阶梯、收购
  3. Apache Spark — Wikipedia — Spark 起源与 MapReduce 缺陷
  4. Ali Ghodsi: "Being an outsider in Sweden gave me the drive to succeed" — Silicon Valley Nordic Beat — 童年最丰富的一手来源
  5. Seven Academics Who Had Never Run a Company — Stacksync — Databricks 创立叙事
  6. Databricks 2016 Leadership Change — Databricks 官方公告 — CEO 交棒
  7. Databricks CEO met his founding team during college — Fortune — 教育与 AI 时代
  8. What Is a Data Lakehouse? — Databricks Blog — lakehouse 论点的奠基文献
  9. Databricks vs. Snowflake — Foundation Capital — 竞争深度分析
  10. Databricks Acquires MosaicML — Databricks 官方公告 — $1.3B 收购
  11. Series J $10B 融资公告(Databricks 官方)— 2024-12 标志性融资
  12. Series K >$100B 融资公告(Databricks 官方)— 2025
  13. Databricks Launches DBRX — Databricks 官方公告 — 开源 LLM 战略
  14. Change is coming for major cloud providers — SiliconANGLE — 超大规模云"亦敌亦友"
  15. 10 years ago founder Ali Ghodsi struggled to give the software away — The Stack — 创立前的挣扎、Horowitz 故事
  16. Ali Ghodsi — UC Berkeley EECS Faculty Page — 学术记录
  17. Learnings from Ali Ghodsi on the journey to $1B+ ARR — Unusual Ventures — 领导力与扩张哲学
  18. "It's dumb to IPO this year" — TechCrunch / Yahoo Finance — 保持私有的理由
  19. Databricks CEO says his company will be worth $1 trillion — Fortune — 当前万亿愿景
  20. Databricks CEO: 2026 is "a terrible year to go public" — The Next Web — 2026-06 第三次推迟 IPO(转述 Bloomberg 2026-06-04 访谈)
  21. "AI doesn't have an intelligence problem. It has a context problem." — CNBC (2026-05-20) / StartupHub.ai 对 Bloomberg Technology 活动的报道 — 2026 年中 AI 论点

播客访谈(6 期)

节目主持人集数标题日期重点引用
20VCHarry StebbingsThe 3 Phases of Startup Growth, How to Evaluate Risk...2021-01-14sky is falling 演习、lowlights 强制汇报、先销售后市场、财务制衡、process over intuition、conflict-aversion 危险
Invest Like the Best (Founder's Field Guide)Patrick O'ShaughnessyThe Past, Present, and Future of Big Data2021-01-28Moore's Wall、开源反锁定(厂商自满动力学)、捡垃圾 vs 建流程、与强 leader 建信任最耗时
a16z Livea16zAI Revolution: Food Fights in the Enterprise2023-09-27企业数据是 kryptonite、Cisco 路由器类比、小模型 vs 大模型、MosaicML 收购逻辑
Stanford Entrepreneurial Thought Leaders(Stanford eCorner)Lessons from a Large Founding Team2024-05-1599% 努力在前方、open source 两个 home run、vitamin vs painkiller、petabyte 排序、asymmetric moves
Stanford eCorner(clip)A Company's Culture Is the Personality of Its CEO2024-05-16culture = CEO 人格、culture principles、truth-seeking
The Logan Bartlett ShowLogan BartlettDatabricks CEO Ali Ghodsi Breaks Down the AI Hype-Cycle2024-11-22non-consensus bets、compound AI systems、humans are the longest pole、FANGDB、"one bullet"、不相信面试

未使用但已扫描的

  • CNBC Television 多个 Ali Ghodsi 片段(7954608、1362833)— TV 新闻短片,按质量过滤器排除
  • Microsoft Ignite Demo(1500849)、Data + AI Summit Keynote(1500818)— 公司 PR/演示,排除
  • Goldman Sachs Talks(2848107)、MAD Podcast 会议 fireside chat(4873334)、Fortt Knox 两期(4909109、4909256)— 机构宣传栏目/会议对谈/视频专栏,非白名单深度访谈,排除
  • Data + AI Summit 2026 keynote lineup 公告(2026-06-02)— 会议宣传 PR,排除;Summit 6 月 15–18 日才开幕,本次 refresh 时尚无内容可折