列表數據的組織維度怎么判斷?
(1)數據的維度是數據的組織形式。
根據數據的關系不同,數據組織可以分為:一維數據、二維數據,多維數據和高維數據:
一維數據采用線性方式組織,對應于數學中數組的概念
二維數據,也稱表格數據,采用二維表格方式組織,它包括列表,對應于數學中的矩陣,
多維數據由一維或二維數據在新維度上擴展形式,比如說加上時間維度。
高維數據由鍵值對類型的數據構成,采用對象方式組織,可以多層嵌套。
(2)Python中數據的維度
一維數據:列表和集合類型
二維或多維數據:列表
高維數據:字典、JSON、XML、YAML
(3)一維數據的處理
A. 一維數據是最簡單的數據組織類型,由于是線性結構,在Python語言中主要采用列表形式表示。
B. 一維數據的文件存儲:一維數據的文件存儲有多種方式,總體思路是采用特殊字符分隔各數據。常用存儲方法包括如下四種:
分隔符 例子
采用空格分隔元素 北京 上海 天津 重慶
采用逗號分隔元素 北京,上海,天津,重慶
采用換行分隔元素
采用其他特殊符號元素 北京;上海;天津;重慶
這4種方法中,逗號分隔的存儲格式叫作CSV格式,即逗號分隔值。存儲的文件一般采用**.csv**為擴展名。英文逗號!
大部分編輯器都支持直接讀入或保存文件為CSV格式
一維數據保存成CSV格式后,各元素采用逗號分隔,形成一行。從Python表示到數據存儲,需要將列表對象輸出為CSV格式以及將CSV格式讀入成列表對象
C. 對一維數據進行處理
=> 將CSV格式讀入成列表對象
首先需要從CSV格式文件讀入一維數據,并將其表示為列表對象。
需要注意,最后一個元素后面有一個換行符(“\n”)。需要采用字符串的strip()方法去掉尾部的換行符,進一步使用split()方法以逗號進行分割。