摘要:由于工作原因,不得不與一個二逼團隊合作,我說直接導出文件給我就好了,而他們堅持要導出文件?;蛘咚麄冇兴麄兊脑虬?,但我還是要叫他們二逼團隊,懶得了解他們有什么苦衷。
由于工作原因,不得不與一個二逼團隊合作,
我說直接導出SQL文件給我就好了,而他們堅持要導出XML文件。
或者他們有他們的原因吧,但我還是要叫他們二逼團隊,懶得了解他們有什么苦衷。
我想MySQL應該是支持導入XML的話,搜索的結果是什么我忘了。
反正我最后決定還是自己寫一段PHP來生成SQL語句。
XML數(shù)據(jù)結構大概是這樣子的:
文件很大,有很多,也就是很多記錄,但是單個記錄里的數(shù)據(jù)并不大。
PHP里關于XML的操作有很多類和函數(shù)。
詳見:http://php.net/manual/zh/refs.xml.php
其中常用的應該是XMLReader、SimpleXML(純屬個人感覺,并沒有數(shù)據(jù)支持)
XMLReader是以文件流的方式 一句一句讀取,主要用來處理體積很大的XML文件,但用起來比較麻煩。
SimpleXML用起來則便捷了許多,但它沒辦法處理很大的XML數(shù)據(jù)。
剛開始我只用XMLReader來導入,當然也是可以導入的,但是嵌套了好幾層循環(huán)和判斷。
要不是后來又要導入一批數(shù)據(jù),我?guī)缀跻詾橹荒苓@樣寫了。
第二次導入的時候,我采用的方法是結合XMLReader和SimpleXML,
因為不管你XML文件再怎么大,單條記錄的數(shù)據(jù)能大到哪里去?(我說的是一般情況)
想到這個方法之后,于是代碼就簡潔到 我都不好意思發(fā)出來的程度了。
但是為了讓這篇文章的讀者 對這種簡潔有個更直觀的感受,我還是厚著臉皮發(fā)一下吧:
open(__DIR__ . "/company.xml"); while($xml->read()) { if($xml->name=="object" and $xml->nodeType==XMLReader::ELEMENT) { // 進入 object $inXml = $xml->readOuterXML(); // 獲取當前整個 object 內容(字符串) $inXml = simplexml_load_string($inXml); // 轉換成 SimpleXMLElement 對象 // 然后沒有了 就這么簡單 具體怎么保存到數(shù)據(jù)庫 dump 一下 $inXml 你就懂了 var_dump($inXml); } // 繼續(xù)讀取 直到進入下一個 object }
就是這樣了,如果你還在為XMLReader太難用,SimpleXML搞不定大文件,而苦苦搜尋“php xml 操作類 大文件”,這篇文章的思路應該就是你需要的。
文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://systransis.cn/yun/21107.html
摘要:由于工作原因,不得不與一個二逼團隊合作,我說直接導出文件給我就好了,而他們堅持要導出文件。或者他們有他們的原因吧,但我還是要叫他們二逼團隊,懶得了解他們有什么苦衷。 由于工作原因,不得不與一個二逼團隊合作,我說直接導出SQL文件給我就好了,而他們堅持要導出XML文件?;蛘咚麄冇兴麄兊脑虬?,但我還是要叫他們二逼團隊,懶得了解他們有什么苦衷。 我想MySQL應該是支持導入XML的話,搜索...
摘要:由于我需要獲取普通用戶的微博內容,因此還要想辦法繼續(xù)繞。默認是勾上的,也即是說微博團隊主觀上是希望用戶勾上這個,從而借助判斷來提高登錄安全性的。我遂果斷取消勾選該選項,輸入任何一個自己的微博賬號密碼,點擊登錄。 有時或基于以下凡此種種需求,我們會想要去抓取新浪微博的內容: 產(chǎn)品冷啟動,導入外部數(shù)據(jù),而非從頭積累; 通過大數(shù)據(jù)+語義分析獲取用戶興趣行為偏好,提供智能推薦; 監(jiān)控微博輿...
閱讀 1351·2023-04-25 23:47
閱讀 929·2021-11-23 09:51
閱讀 4481·2021-09-26 10:17
閱讀 3729·2021-09-10 11:19
閱讀 3268·2021-09-06 15:10
閱讀 3556·2019-08-30 12:49
閱讀 2436·2019-08-29 13:20
閱讀 1743·2019-08-28 18:14