是的,你没看错。不到半分钟,1 万美元灰飞烟灭。
不是因为查询效率低下。
不是因为计算资源用得太多。
而是因为一个完全荒谬的计费模式,而且大多数工程师甚至都不知道它存在。
如果你在用 BigQuery,你很可能正在悄悄流血烧钱而毫不自知。
背景:一个简单的查询——我们原以为是这样
上个月,我们在帮一个客户搭建数据流水线。没啥复杂的东西——只是从一个大型公共表中做个基础的数据抽样任务。考虑到数据集的规模,我们做了一些预防措施:
用了 LIMIT 语句限制结果为 10 万行
查询瞬间完成——看起来一切正常
我们跑了这个查询三次
查询的具体内容如下:
EXPORT DATA
OPTIONS (
uri = 'gs://xxxxx/*.json',
format = 'JSON',
overwrite = true)
AS (
SELECT *
FROM bigquery-public-data.crypto_solana_xxxxx.Instructions
LIMIT 1000000
);
这个查询会从 crypto_solana 数据集的 Instructions 表中导出 1,000,000 行数据(BigQuery 的公共数据集里),以 JSON 格式导出到一个 Google Cloud Storage 的 bucket 里。
账单来了:三次查询花了 $9,847.24?!
|