h5py快速入門指南

desdik 發(fā)布于2019-07-31 11:12 / 2725人閱讀

摘要：下面的文章主要介紹的快速入門指南，翻譯自的官方文檔。當(dāng)使用時(shí)，最基本的準(zhǔn)則為類似于字典，類似于中的數(shù)組。所有的和都支持幾個(gè)數(shù)據(jù)位的附屬命名，稱為屬性。

h5py是Python語言用來操作HDF5的模塊。下面的文章主要介紹h5py的快速入門指南，翻譯自h5py的官方文檔：http://docs.h5py.org/en/lates... 。該翻譯僅為個(gè)人學(xué)習(xí)h5py為目的，如有翻譯不當(dāng)之處，請(qǐng)速聯(lián)系筆者或提供正確的翻譯，非常感謝！

安裝

使用Anaconda或者M(jìn)iniconda:

conda install h5py

用Enthought Canopy，可以使用GUI安裝包安裝或用

enpkg h5py

安裝。用pip或setup.py安裝，請(qǐng)參考安裝方式。

核心概念

一個(gè)HDF5文件就是一個(gè)容器，用于儲(chǔ)存兩類對(duì)象：datasets，類似于數(shù)組的數(shù)據(jù)集合；groups，類似于文件夾的容器，可以儲(chǔ)存datasets和其它groups。當(dāng)使用h5py時(shí)，最基本的準(zhǔn)則為：

groups類似于字典（dictionaries），dataset類似于Numpy中的數(shù)組（arrays）。

假設(shè)有人給你發(fā)送了一個(gè)HDF5文件， mytestfile.hdf5（如何創(chuàng)建這個(gè)文件，請(qǐng)參考：附錄：創(chuàng)建一個(gè)文件）.首先你需要做的就是打開這個(gè)文件用于讀取數(shù)據(jù)：

>>> import h5py
>>> f = h5py.File("mytestfile.hdf5", "r")

這個(gè)File對(duì)象是你的起點(diǎn)。那么這個(gè)文件中儲(chǔ)存了什么呢？記住，h5py.File就像一個(gè)Python字典，因此我們可以查看這些鍵值，

>>> list(f.keys())
["mydataset"]

根據(jù)我們的觀察，這個(gè)文件中有一個(gè)dataset，即mydataset. 讓我們把這個(gè)dataset作為Dataset對(duì)象來檢驗(yàn)

>>> dset = f["mydataset"]

我們得到的這個(gè)對(duì)象不是一個(gè)數(shù)組，而是一個(gè)HDF5 dataset. 就像Numpy中的數(shù)據(jù)那樣，datasets有形狀（shape）和數(shù)據(jù)類型（data type）

>>> dset.shape
(100,)
>>> dset.dtype
dtype("int32")

同時(shí)它們也支持?jǐn)?shù)組風(fēng)格的切片操作。下面是你如何完成這個(gè)文件中的一個(gè)dataset的讀寫的方法

>>> dset[...] = np.arange(100)
>>> dset[0]
0
>>> dset[10]
10
>>> dset[0:100:10]
array([ 0, 10, 20, 30, 40, 50, 60, 70, 80, 90])

想要更多參考，請(qǐng)前往File Objects和Datasets.

附錄：創(chuàng)建一個(gè)文件

此時(shí)此刻，你也許會(huì)好奇mytestdata.hdf5是如何創(chuàng)建的。當(dāng)File對(duì)象初始化后，我們通過將模式（mode）設(shè)置為w來創(chuàng)建一個(gè)文件。其它模式（mode）為a（用于讀、寫、新建）和r+（用于讀、寫）。一個(gè)完整的File模式以及它們的含義的列表可參考File對(duì)象。

>>> import h5py
>>> import numpy as np
>>> f = h5py.File("mytestfile.hdf5", "w")

File對(duì)象有幾個(gè)看上去挺有趣的方法。其一為create_dataset，顧名思義，就是通過給定形狀和數(shù)據(jù)類型來創(chuàng)建一個(gè)dataset

>>> dset = f.create_dataset("mydataset", (100,), dtype="i")

File對(duì)象是上下文管理器，因此，下面的代碼也可運(yùn)行

>>> import h5py
>>> import numpy as np
>>> with h5py.File("mytestfile.hdf5", "w") as f:
>>>     dset = f.create_dataset("mydataset", (100,), dtype="i")

Groups和分層結(jié)構(gòu)

“HDF”是“Hierarchical Data Format”的縮寫。每個(gè)HDF5文件中的對(duì)象都有一個(gè)名字（name），它們以類似于POSIX風(fēng)格的分層結(jié)構(gòu)存放，用/分隔符分隔

>>> dset.name
u"/mydataset"

在這個(gè)系統(tǒng)中“文件夾”（folders）被命名為groups. 我們創(chuàng)建的File對(duì)象本身也是一個(gè)group, 在這種情形下是根group（root group），名字為/:

>>> f.name
u"/"

創(chuàng)建一個(gè)子group（subgroup）可以通過一個(gè)巧妙的命令create_group來完成。但是，我們首先需要以讀/寫模式來打開文件

>>> f = h5py.File("mydataset.hdf5", "r+")
>>> grp = f.create_group("subgroup")

所有Group對(duì)象，如同F(xiàn)ile對(duì)象一樣，也有create_*方法：

>>> dset2 = grp.create_dataset("another_dataset", (50,), dtype="f")
>>> dset2.name
u"/subgroup/another_dataset"

順便說一句，你不需要手動(dòng)地創(chuàng)建所有的中間groups. 指定一個(gè)完整的路徑同樣可行

>>> dset3 = f.create_dataset("subgroup2/dataset_three", (10,), dtype="i")
>>> dset3.name
u"/subgroup2/dataset_three"

Groups支持大部分的Python字典風(fēng)格的接口。你可以使用條目獲?。╥tem-retrieval）的語法來獲取這個(gè)文件中的對(duì)象：

>>> dataset_three = f["subgroup2/dataset_three"]

迭代一個(gè)group，就會(huì)產(chǎn)生它的成員的名字：

>>> for name in f:
...     print name
mydataset
subgroup
subgroup2

成員關(guān)系檢測(cè)也可以通過使用名字來實(shí)現(xiàn)：

>>> "mydataset" in f
True
>>> "somethingelse" in f
False

你甚至可以使用完整的路徑的名字：

>>> "subgroup/another_dataset" in f
True

它也有你熟悉的keys(), values(), items() 和iter() 的方法，以及get()方法。

因?yàn)榈粋€(gè)group只會(huì)產(chǎn)生它的直屬成員，所以想要迭代一個(gè)完整的文件，可以使用Group的方法visit()和visititems(), 它們通過一個(gè)調(diào)用（callable）來實(shí)現(xiàn):

>>> def printname(name):
...     print name
>>> f.visit(printname)
mydataset
subgroup
subgroup/another_dataset
subgroup2
subgroup2/dataset_three

想要更多參考，請(qǐng)前往Groups.

屬性

HDF5的最好特征之一就是你可以在描述的數(shù)據(jù)后儲(chǔ)存元數(shù)據(jù)（metadata）。所有的groups和datasets都支持幾個(gè)數(shù)據(jù)位的附屬命名，稱為屬性。（All groups and datasets support attached named bits of data called attributes.）

屬性可以通過attrs這個(gè)代理對(duì)象來獲取，這會(huì)再一次執(zhí)行字典接口：

>>> dset.attrs["temperature"] = 99.5
>>> dset.attrs["temperature"]
99.5
>>> "temperature" in dset.attrs
True

想要更多參考，請(qǐng)前往Attributes.

GPU云服務(wù)器云服務(wù)器前端快速入門云計(jì)算快速入門 css快速入門 html快速入門

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/44775.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

desdik

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

tensorflow是什么語言

閱讀 2702·2023-04-26 00:07
先轉(zhuǎn)行從零基礎(chǔ)入門學(xué)編程可以嗎？

閱讀 2458·2021-11-15 11:37
野草云：香港特惠云服務(wù)器年付138元起,獨(dú)立服務(wù)器月付399元起

閱讀 678·2021-10-19 11:44
電信給的主機(jī)地址是什么情況-什么叫主機(jī)地址？

閱讀 2203·2021-09-22 15:56
軟件測(cè)試報(bào)告怎么編寫，最新軟件測(cè)試模板推薦【建議收藏】

閱讀 1767·2021-09-10 10:50
Ceraus：818上新美國CN2+GAI新用戶五五折續(xù)費(fèi)七折

閱讀 1530·2021-08-18 10:21
less學(xué)習(xí)

閱讀 2597·2019-08-30 15:53
常見的CSS預(yù)處理器之Less初體驗(yàn)

閱讀 1656·2019-08-30 11:11

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

h5py快速入門指南

相關(guān)文章

TensorFlow 2.0 / TF2.0 入門教程實(shí)戰(zhàn)案例

22、Python快速開發(fā)分布式搜索引擎Scrapy精講—scrapy模擬登陸和知乎倒立文字驗(yàn)證碼識(shí)

發(fā)表評(píng)論

0條評(píng)論

desdik

男|高級(jí)講師

TA的文章

tensorflow是什么語言

先轉(zhuǎn)行從零基礎(chǔ)入門學(xué)編程可以嗎？

野草云：香港特惠云服務(wù)器年付138元起,獨(dú)立服務(wù)器月付399元起

電信給的主機(jī)地址是什么情況-什么叫主機(jī)地址？

軟件測(cè)試報(bào)告怎么編寫，最新軟件測(cè)試模板推薦【建議收藏】

Ceraus：818上新美國CN2+GAI新用戶五五折續(xù)費(fèi)七折

less學(xué)習(xí)

常見的CSS預(yù)處理器之Less初體驗(yàn)

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

h5py快速入門指南

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！