10行Python代码创建可视化地图

简介:

 
 
  1. import vincent 
  2. world_countries = r'world-countries.json' 
  3. world = vincent.Map(width=1200, height=1000) 
  4. world.geo_data(projection='winkel3', scale=200, world=world_countries) 
  5. world.to_json(path) 

 10行Python代码创建可视化地图

当我开始建造Vincent时, 我的一个目的就是使得地图的建造尽可能合理化. 有一些很棒的python地图库-参见Basemap 和 Kartograph能让地图更有意思. 我强烈推荐这两个工具, 因为他们都很好用而且很强大. 我想有更简单一些的工具,能依靠Vega的力量并且允许简单的语法点到geoJSON文件,详细描述一个投影和大小/比列,最后输出地图.

例如, 将地图数据分层来建立更复杂的地图:

 
 
  1. vis = vincent.Map(width=1000, height=800) 
  2. #Add the US county data and a new line color 
  3. vis.geo_data(projection='albersUsa', scale=1000, counties=county_geo) 
  4. vis + ('2B4ECF''marks', 0, 'properties''enter''stroke''value'
  5.  
  6. #Add the state data, remove the fill, write Vega spec output to JSON 
  7. vis.geo_data(states=state_geo) 
  8. vis - ('fill''marks', 1, 'properties''enter'
  9. vis.to_json(path) 

10行Python代码创建可视化地图

加之,等值线地图需绑定Pandas数据,需要数据列直接映射到地图要素.假设有一个从geoJSON到列数据的1:1映射,它的语法是非常简单的:

 
 
  1. #'merged' is the Pandas DataFrame 
  2. vis = vincent.Map(width=1000, height=800) 
  3. vis.tabular_data(merged, columns=['FIPS_Code''Unemployment_rate_2011'])  
  4. vis.geo_data(projection='albersUsa', scale=1000, bind_data='data.id', counties=county_geo) 
  5. vis + (["#f5f5f5","#000045"], 'scales', 0, 'range'
  6. vis.to_json(path) 

10行Python代码创建可视化地图

我们的数据并非没有争议无需改造——用户需要确保 geoJSON 键与熊猫数据框架之间具有1:1的映射。下面就是之前实例所需的简明的数据框架映射:我们的国家信息是一个列有FIPS 码、国家名称、以及经济信息(列名省略)的 CSV 文件:

 
 
  1. 00000,US,United States,154505871,140674478,13831393,9,50502,100 
  2. 01000,AL,Alabama,2190519,1993977,196542,9,41427,100 
  3. 01001,AL,Autauga County,25930,23854,2076,8,48863,117.9 
  4. 01003,AL,Baldwin County,85407,78491,6916,8.1,50144,121 
  5. 01005,AL,Barbour County,9761,8651,1110,11.4,30117,72.7 

在 geoJSON 中,我们的国家形状是以 FIPS 码为id 的(感谢 fork 自 Trifacta 的相关信息)。为了简便,实际形状已经做了简略,在示例数据可以找到完整的数据集:

 
 
  1. {"type":"FeatureCollection","features":[ 
  2. {"type":"Feature","id":"1001","properties":{"name":"Autauga"
  3. {"type":"Feature","id":"1003","properties":{"name":"Baldwin"
  4. {"type":"Feature","id":"1005","properties":{"name":"Barbour"
  5. {"type":"Feature","id":"1007","properties":{"name":"Bibb"
  6. {"type":"Feature","id":"1009","properties":{"name":"Blount"
  7. {"type":"Feature","id":"1011","properties":{"name":"Bullock"
  8. {"type":"Feature","id":"1013","properties":{"name":"Butler"
  9. {"type":"Feature","id":"1015","properties":{"name":"Calhoun"
  10. {"type":"Feature","id":"1017","properties":{"name":"Chambers"
  11. {"type":"Feature","id":"1019","properties":{"name":"Cherokee"

我们需要匹配 FIPS 码,确保匹配正确,否则 Vega 无法正确的压缩数据:

 
 
  1. import json 
  2. import pandas as pd 
  3. #Map the county codes we have in our geometry to those in the 
  4. #county_data file, which contains additional rows we don't need 
  5. with open(county_geo, 'r'as f: 
  6.     get_id = json.load(f) 
  7.  
  8. #Grab the FIPS codes and load them into a dataframe 
  9. county_codes = [x['id'for x in get_id['features']] 
  10. county_df = pd.DataFrame({'FIPS_Code': county_codes}, dtype=str) 
  11.  
  12. #Read into Dataframe, cast to string for consistency 
  13. df = pd.read_csv(county_data, na_values=[' ']) 
  14. df['FIPS_Code'] = df['FIPS_Code'].astype(str) 
  15.  
  16. #Perform an inner join, pad NA's with data from nearest county 
  17. merged = pd.merge(df, county_df, on='FIPS_Code', how='inner'
  18. merged = merged.fillna(method='pad'
  19.  
  20. >>>merged.head() 
  21.       FIPS_Code State       Area_name  Civilian_labor_force_2011  Employed_2011  \ 
  22.     0      1001    AL  Autauga County                      25930          23854    
  23.     1      1003    AL  Baldwin County                      85407          78491    
  24.     2      1005    AL  Barbour County                       9761           8651    
  25.     3      1007    AL     Bibb County                       9216           8303    
  26.     4      1009    AL   Blount County                      26347          24156 
  27.  
  28.    Unemployed_2011  Unemployment_rate_2011  Median_Household_Income_2011  \ 
  29. 0             2076                     8.0                         48863    
  30. 1             6916                     8.1                         50144    
  31. 2             1110                    11.4                         30117    
  32. 3              913                     9.9                         37347    
  33. 4             2191                     8.3                         41940 
  34.  
  35.    Med_HH_Income_Percent_of_StateTotal_2011   
  36. 0                                     117.9   
  37. 1                                     121.0   
  38. 2                                      72.7   
  39. 3                                      90.2   
  40. 4                                     101.2 

现在,我们可以快速生成不同的等值线:

 
 
  1. vis.tabular_data(merged, columns=['FIPS_Code''Civilian_labor_force_2011'])  
  2. vis.to_json(path) 

10行Python代码创建可视化地图

这只能告诉我们 LA 和 King 面积非常大,人口非常稠密。让我们再看看中等家庭收入:

 
 
  1. vis.tabular_data(merged, columns=['FIPS_Code''Median_Household_Income_2011']) 
  2. vis.to_json(path) 

10行Python代码创建可视化地图

明显很多高收入区域在东海岸或是其他高密度区域。我敢打赌,在城市层级这将更加有趣,但这需要等以后发布的版本。让我们快速重置地图,再看看国家失业率:

 
 
  1. #Swap county data for state data, reset map 
  2. state_data = pd.read_csv(state_unemployment) 
  3. vis.tabular_data(state_data, columns=['State''Unemployment']) 
  4. vis.geo_data(bind_data='data.id', reset=True, states=state_geo) 
  5. vis.update_map(scale=1000, projection='albersUsa'
  6. vis + (['#c9cedb''#0b0d11'], 'scales', 0, 'range'
  7. vis.to_json(path) 

10行Python代码创建可视化地图

地图即是我的激情所在——我希望 Vincent 能够更强,包含轻松的添加点、标记及其它的能力。如果各位读者对于映射方面有什么功能上的需求,可以在Github上给我发问题。 


本文作者:renwofei423

来源:51CTO

相关文章
|
21小时前
|
Python
Python中的装饰器:提升代码可读性与复用性
Python中的装饰器是一种强大的工具,能够提升代码的可读性和复用性。本文将深入探讨装饰器的原理、用法以及在实际项目中的应用,帮助读者更好地理解和利用这一特性,提升代码质量和开发效率。
|
1天前
|
JSON 数据可视化 Shell
数据结构可视化 Graphviz在Python中的使用 [树的可视化]
数据结构可视化 Graphviz在Python中的使用 [树的可视化]
8 0
|
1天前
|
监控 Python
Python中的装饰器:提升代码可读性与可维护性
Python中的装饰器是一种强大的工具,可以在不修改函数源代码的情况下,增加新的功能。本文将介绍装饰器的基本概念,以及如何使用装饰器来提升代码的可读性和可维护性。通过实例演示,读者将了解装饰器在各种场景下的灵活运用,从而更好地理解并应用于实际开发中。
|
1天前
|
缓存 Python
Python中的装饰器:提升代码可读性与灵活性
在Python编程中,装饰器是一种强大的工具,可以通过在函数或方法周围包装额外的功能来提升代码的可读性和灵活性。本文将深入探讨装饰器的概念、用法和实际应用,帮助读者更好地理解并运用这一Python编程的利器。
|
2天前
|
缓存 并行计算 Serverless
优化Python代码性能的5个技巧
在日常Python编程中,代码性能的优化是一个重要的议题。本文介绍了5个实用的技巧,帮助你提高Python代码的执行效率,包括使用适当的数据结构、优化循环结构、利用内置函数、使用生成器表达式以及并行化处理。通过这些技巧,你可以更高效地编写Python代码,提升程序的性能和响应速度。
|
3天前
|
Python
探索Python中的装饰器:提升代码灵活性与可维护性
Python中的装饰器是一种强大的工具,可以在不改变原有代码结构的情况下,动态地添加功能或修改函数的行为。本文将深入探讨装饰器的原理、常见用法以及如何利用装饰器提升代码的灵活性和可维护性。
|
4天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
4天前
|
数据可视化 Python
python中Copula在多元联合分布建模可视化2实例合集|附数据代码
python中Copula在多元联合分布建模可视化2实例合集|附数据代码
|
4天前
|
人工智能 Python
Python中的反对称矩阵:理论、应用与代码实践
Python中的反对称矩阵:理论、应用与代码实践
22 1
|
4天前
|
机器学习/深度学习 存储 算法
Python套索回归lasso、SCAD、LARS分析棒球运动员薪水3个实例合集|附数据代码
Python套索回归lasso、SCAD、LARS分析棒球运动员薪水3个实例合集|附数据代码