箭头 信封 脸谱网 instagram linkedin上 推特 yelp youtube

从墨西哥美食到除雪

美国西南部盛产墨西哥食物

美国邮政编码,是Yelp上墨西哥餐馆的“热点”

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

快速浏览一下美墨边境地图,你会发现墨西哥食物在德克萨斯州南部、新墨西哥州和加利福尼亚州可能是相对受欢迎的。事实上,墨西哥餐厅的集中与被认为是西班牙裔或拉丁裔的人口

一些业务集群与真实世界的人口统计学证据和直觉相匹配。然而,有时候,我们的直觉或地图并没有多大帮助。

想知道墨西哥煎玉米卷连锁店向北扩散到多远的地方吗?想知道墨西哥食品在美国其他地方的分布有多广吗?或者想知道美国哪些地方最适合开运动酒吧或意大利面餐厅?远离意大利,你只能走这么远。Yelp数据和Yelp数据科学可以提供帮助。

您可能遇到过像上面地图中那样的业务集群,即使业务类型或地点不同。你是否曾在一个新的地方寻找食物,却在几英里内一无所获,然后突然间发现了一大堆选择?餐厅聚集在同一个小区域并非巧合;由于邻近而产生的网络利益包括从租金、劳动力到供应链成本等方方面面。这种效应被称为经济的集聚而且在城市里很容易被发现,特别是对于餐馆等能见度很高的企业。但是,我们能否在更大的区域和不同的业务类型中看到这种效应呢?

为了探究这个问题,我研究了Yelp特定类别的企业位于哪里,以及这些类型的企业是否有统计上显著的地理热点。

为此,我首先定义了我认为的热点是什么。在这个练习中,我将热点定义为(a)在地理上相邻的区域——无论边界有多小;也被称为女王接触(b)每个邮政编码地区在给定类别中的所有企业的比例都相当高(我将这个数量称为pbc -类别中企业的百分比)。我使用邮政编码来捕获高度本地化的企业集团,而这种方式是郡县等更大的地理单元可能无法实现的。

关键的问题是:我们如何知道两个相邻地区是否在某一特定类型的企业中同样富有,从而使我们不仅拥有一个温暖的小点,而是一个热点?这就是我们采用的一种方法,即本地测量法莫兰的我统计.对于每个邻居对,它计算每个邻居的PBC值与所有区域的平均值之间的距离,以及两个邻居的PBC值彼此之间的相似性。这使我们能够识别具有类似且同样高的PBC值的所有邻居集群。请记住,两个具有相似PBC值的候选集群可能非常不同:一个可能由两个小城镇组成,每个小城镇有10个企业,其中一个是博物馆;另一个集群可以由两个大城市组成,每个城市有1000家企业,其中100家是博物馆。这种方法让每个区域都有相同的机会被标记为热点,这可能并不总是直观的。

下一步是确定这些星团是否具有显著的非随机性,足以被认为是真正的热点。但是我们怎么知道某个特定的业务分布是非随机的呢?即使是所谓的完全空间随机性(CSR)——基本上,每个企业在这个国家都被随机分配到一个位置,我们预计会由于偶然而观察到某种程度的集群。

为了回答这个问题,我收集了所有在不同地区观察到的PBC值,并以1000种不同的方式将它们随机放置在地图上。从每个映射中,我为每个邻居对计算一个单独的Moran’s I统计量,这产生了统计量可能值的分布。然后,真实的莫兰值可以与1000个随机生成的分布中的值进行比较,以确定企业真实布局的统计重要性。

鼠标悬停或点击地图以放大

西部更热
西南
中西部
东南
东北部更热

瑜伽

热点
不是热点

为每个业务类别,生成的地图显示,统计上显著的地理热点在美国大陆,需要注意的是,美国的高可变性的人口密度意味着更小、高密度热点不会看起来一样令人印象深刻的地图上我们会更大,密度较低热点。例如,如果蒙大拿州一大片人烟稀少的地区书店的比例非常高,那么它在视觉上就会比马萨诸塞州一大片人烟稀少、书店比例同样高的地区更引人注目。一个热点看起来会很不同以人群为基础的统计图每个地区的面积由人口决定。

尽管如此,你还是可以从地图上看到很多有趣的见解。以该方法为运动酒吧确定的热点为例。威斯康辛州以其对绿湾包装工队和威斯康星大学獾队的忠诚而闻名,如今却沐浴在红色之中。看来全国最狂热的体育迷都能在中西部的酒吧里找到座位。

奶酪头喜欢他们的运动酒吧

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

18世纪末,在成千上万法裔加拿大人移民到美国后,卡真菜诞生于美国南部,其中大多数移民到了路易斯安那州。所以,这种源自法国乡村的丰盛菜肴仍然统治着它的原产地也就不足为奇了。

路易斯安那州是美国卡津人的首府

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

南方腹地的居民——也被称为“圣经带”——以他们的宗教虔诚而闻名;美国中部的部分地区也紧随其后。

去教堂的人聚集在南方

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

没有任何地方能像美国中部那样适合农业及其相关设备。

密西西比河流域依靠农业设备

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

意大利面在东北部最流行,那里是意大利人最早移民到美国并定居的地方,但在佛罗里达州也越来越受欢迎。

想要面条吗?去东北旅行

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

在气候温暖的亚利桑那州、加利福尼亚州、佛罗里达州和德克萨斯州有大量的游泳池。这为清洁工人创造了很多商机。

泳池清洁工在温暖的气候中茁壮成长

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

哪里有雪,哪里就有除雪生意。东北部和中西部有大量降雪。

北方的除雪生意依然很忙

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

运动用品商店聚集在一些最好的户外运动目的地周围:落基山脉!

落基山脉的探险召唤

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

啤酒花园在德克萨斯州和西北地区很受欢迎,其他热点也遍布全国各地——不仅仅是在气候足够热的地方,全年都可以在户外喝啤酒。

啤酒花园遍布美国各地

热点
不是热点

*用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

来源:Yelp

图:DataFace

对一个你还没有看过映射的类别感到好奇吗?查看我们与更多地图的互动,覆盖类别包括珍珠奶茶和犹太教堂。

告诉我……的热点。

    热点
    不是热点

    *用浅灰色标记的地理区域不属于人口普查局定义的近似邮政编码边界。

    来源:Yelp

    图:DataFace

    图形的的DataFace