美国大数据创业公司篇

原帖地址:知乎专栏

这里面创业公司太多了,包含提供商务数据分析,可视化报表,大数据平台,数据存储,挖掘应用等,我就简单说一些我感兴趣的,它们大多在硅谷,其他的可以参考。更新到2015年6月8日,92家。

Palantir:融资:9.5亿美元。150亿美金估值,已经是超级独角兽单独列出来。Peter Thiel创办大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,并发现趋势、 关系和异常,包括预测分析。

##############

Database

MemSQL: 号称最快的内存数据库。

GraphSQL:高效、大容量的图形数据库和分析平台,创始人是国人。

MongoDB: 融资:3.11亿美元。细分行业:面向文档数据库采集。它灵活的存储方式非常受青睐。

DataStax:融资:1.9亿美元。细分行业:基于Apache Cassandra的数据库支持平台。客户包括eBay、Adobe、Netflix等

Couchbase: 文档型数据库,高性能,在LinkedIn运维也推荐使用

FoundationDB: 兼容事务处理的NoSQL

RethinkDB: open-source, scalable database that makes building realtime apps dramatically easier.

RocksDB: FB旗下的开源数据库类似LevelDB.org设计

Presto:FB旗下分布式SQL查询引擎

Hadoop

Hadoop 三剑客其中 Hortonworks 已经上市

Cloudrea:融资:10.4亿美元。细分行业:大数据分析软件、服务与培训。今年,这家大数据巨头企业即将进入中国市场。

MapR:融资:1.74亿美元。细分行业:大数据分析软件、服务与培训。它的创始团队来自Facebook、Google和Yahoo等公司

Altiscale: 提供的Hadoop作为一种服务(HAAS)

Qubole:Hadoop服务提供商,一些创业公司如Pinterest也是它的客户

Splice Machine: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP 和OLAP 应用进行实时优化处理

Continuuity: a Hadoop-based big data application hosting platform.

Platfora: Provide a big data analytics solution that transforms raw data in Hadoop into interactive, in-memory business intelligence.

Xplenty: Provide HaaS.

Nuevora: Provide Big Data analytics applications.

机器学习

Everstring:通过不断地主动挖掘和分析全网在线企业信息,结合每家企业内部的客户关系管理系统,利用机器学习自动建立量化客户模型预测谁是下一个客户。

Luminoso:自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题

Dato:GraphLab提供了一个完整的平台,从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。

Paxata:应用机器学习技术处理大数据难题

0xdata:H2O 的算法是面向业务流程——欺诈或趋势预测

Numenta:developed a cohesive theory, core software technology, and numerous applications all based on principles of the neocortex

PredictionIO:开源的机器学习服务器

Alpine Data Labs: 大数据预测分析

Zementis: 预测分析决策管理平台

Trifacta:人机交互数据分析平台

Metamind: 提供相当完美的人工智能解决方案,这种解决方案主要由“深度学习(DL)”支持

RapidMiner:数据挖掘工具

FiscalNote: 数据挖掘软件和人工智能手艺预测立法机构的投票成果,从而判断某些议案可否通过。

BI工具和其他

Looker:一个基于Web的BI平台,目前已以与Amazon Redshift、 Teradata Aster、HP Vertica、Greenplum、Impala、 BigQuery以及Spark等数据源进行集成;定制和复用数据可视化体验。

Confluent:Kafka初创公司。

Databricks:主要开发Spark。

Elasticsearch:分布式搜索引擎,基于Lucene开发

Tachyon Nexus: 主要开发Tachyon。

Snowplow Analytics:开放代码的分析平台,特别是基于AWS的分析。

Datameer:开源的数据处理系统,用于构建强大的超级计算机廉价服务器集群。

DataSift:社交数据分析公司

Datadog:数据监控

Sumo logic:日志管理过滤

Ginger.io: 为研究人员、物理学家和医疗保健人员提供相应的行为分析能力

Birst :从事商业智能和数据分析,利用云计算来颠覆传统的IT服务模式

Interana:自助分析数据平台

gridgain: 基于内存的大数据实时处理系统

Lucidworks:Solr企业版

DataTorrent :可以将数据处理速度从实时提高至“现在时”

WibiData:专业大数据软件包

Dataguise:大数据安全公司

Aerospike:开源NoSQL数据库,支持近实时数据分析

Accumulo:可靠的、可伸缩的、高性能的排序分布式的Key-Value 存储解决方案,基于单元访问控制以及可定制的服务器端处理

Pentaho:以工作流为核心的、强调面向解决方案而非工具组件的BI

Metamarkets:可视化分析,帮助在线媒体公司分析高流量的流媒体数据

Pivotal:一个以数据为核心的企业级PaaS平台

Pachyderm:Dockerized MapReduce

Premise:走众包数据采集途径向金融机构提供数据

Domo:融资:2.5亿美元。细分行业:云商务智能。它的主要服务客户是企业用户,其数据库可以帮助企业维持日常的运转。

SumAll:social media analytics and business dashboard

Tintri:“智能混合闪存”,混合了闪存和计算机硬盘驱动器

Datarella:Big Data Strategy & Product Development

Snowflake:云数据仓库

GoodData:融资:1.01亿美元。细分行业:云商务智能。GoodData向SaaS供应商提供技术集成服务,在平台内获得分析数据。

Amplitude:BI分析软件

Mu Sigma: 融资:1.95亿美元。细分行业:大数据科学服务。这是一家向企业客户提供数据分析和决策支持服务的研究公司。

Mixpanel:有web和移动分析平台,其提供的服务可以分析监测用户活动

DataHero:打着“你的数据你做主”的口号,试图弥合大数据同普通用户之间的鸿沟,即帮你分析跟你密切相关的数据

Opera Solutions融资:1.22亿美元。细分行业:大数据科学服务。其提供的大数据服务可以一次性采集数十亿条数据。

Guavus 融资:1.07亿美元。细分行业:智能解决方案平台。它的主要投资方是英特尔。

Kissmetrics:分析服务公司

treasuredata: 提供大数据存储,查询,分析云服务

Quantcast: 大数据广告公司

Spagobi: BI 开源工具

Zoomdata: 大数据可视化展示

Birst:商业智能和数据分析,安全性隔离性

Clearstory:大数据分析服务商,帮助企业和客户收集、处理、分析数据

Actian:深藏不露的数据库公司。目前其年收入大约为1.5 亿美元。对 ParAccel 的收购已经是过去5 个月中Actian 进行的第四笔收购

Eclipse BIRT: Eclipse旗下数据可视化

Netezza Analytics: IBM 旗下数据仓库

DataGravity: software-based company engaged in the IT industry and is focused on providing data management services.

Zipfian Academy:Data Science Bootcamp

Civis Analytics:big data analytics firm that helps companies, non-profits, and campaigns leverage their data to develop smarter strategy.

Quid: Business Analytics Software

inPowered:discover the most engaging content written about them and turn them into native ads that are promoted across the web, mobile apps

Cask.co:helps developers and organizations deliver Hadoop solutions more quickly and effectively with the open source

Tamr:quickly, efficiently and cost-effectively connects and enriches all of your internal or external data sources

ScalingData/Rocana: building software for large scale machine data (logs, metrics, etc.) and event management, specifically in the domain.

Ayasdi: use mathematics theory to find potential patterns in data and visualize them as geometric shapes

bloomreach:采用数据学分析让用户手机变得与促销密切相关

roambi:向任何iPad用户发布和传播动态宣传册、报告和介绍.

airtable:easy but powerful organizational tool that works exactly the way you want. It’s as fast and flexible as a spreadsheet, but offers a refreshingly clean

databox:Mobile Business Intelligence Platform

下面是来自Bo Yang的总结

从对美国大数据市场的调研来看,我们可以得到一些启示:

美国的数据分析市场非常大,容纳超过百家公司,这得益于美国信息化的高度发达。

虽然有很多公司,但是大家很少有重复竞争,每一家都有自己的特色,在自己的领域内发展,这也符合美国公司注重差异化相关。

传统的商务数据分析公司在维持旧有客户和平台的情况下,在积极向大数据技术扩展。

新兴的大数据技术发展非常快,但是目前还没有到成熟阶段,除了Hadoop之外,没有其他统一的技术被各家公司采用。

新的大数据技术趋势是快速响应,开始追求数据的实时处理和快速查询。

相对于美国市场,中国的大数据市场还处于非常初期的阶段,这可能跟中国的信息化程度相关。做长期展望预测,如果中国的信息化发展到美国的阶段,并且公司普遍采用基于数据的量化决策机制,将会迎来一个大数据发展的爆发式增长。

参考链接

  1. 10 Hot Big Data Startups to Watch in 2015 from A to Z
  2. 10 Hot Hadoop Startups to Watch
  3. 2015年值得关注的25家初创科技企业
  4. 融资最多的大数据创业企业
  5. 美国大数据创业公司总结