摘要:所以本文將探討多任務協(xié)程這方面的內容。我們僅需在處理前進行檢測即可。方法用于執(zhí)行任務,方法用于讓調度程序知道何時終止運行。它是一種先進先出數(shù)據(jù)結構,能夠確保每個任務都能夠獲取足夠的處理時間。
本文首發(fā)于 PHP 多任務協(xié)程處理,轉載請注明出處!
上周 有幸和同事一起在 SilverStripe 分享最近的工作事宜。今天我計劃分享 PHP 異步編程,不過由于上周我聊過 ReactPHP;我決定討論一些不一樣的內容。所以本文將探討多任務協(xié)程這方面的內容。
另外我還計劃把這個主題加入到我正在籌備的一本 PHP 異步編程的圖書中。雖然這本書相比本文來說會涉及更多細節(jié),但我覺得本文依然具有實際意義!
那么,開始吧!
new MyIterator(
這就是本文我們要討論的問題。不過我們會從更簡單更熟悉的示例開始。
一切從數(shù)組開始我們可以通過簡單的遍歷來使用數(shù)組:
$array = ["foo", "bar", "baz"]; foreach ($array as $key => $value) { print "item: " . $key . "|" . $value . " "; } for ($i = 0; $i < count($array); $i++) { print "item: " . $i . "|" . $array[$i] . " "; }
這是我們日常編碼所依賴的基本實現(xiàn)??梢酝ㄟ^遍歷數(shù)組獲取每個元素的鍵名和鍵值。
當然,如果我們希望能夠知道在何時可以使用數(shù)組。PHP 提供了一個方便的內置函數(shù):
print is_array($array) ? "yes" : "no"; // yes類數(shù)組處理
有時,我們需要對一些數(shù)據(jù)使用相同的方式進行遍歷處理,但它們并非數(shù)組類型。比如對 DOMDocument 類進行處理:
$document = new DOMDocument(); $document->loadXML(""); $elements = $document->getElementsByTagName("div"); print_r($elements); // DOMNodeList Object ( [length] => 1 )
這顯然不是一個數(shù)組,但是它有一個 length 屬性。我們能像遍歷數(shù)組一樣,對其進行遍歷么?我們可以判斷它是否實現(xiàn)了下面這個特殊的接口:
print ($elements instanceof Traversable) ? "yes" : "no"; // yes
這真的太有用了。它不會導致我們在遍歷非可遍歷數(shù)據(jù)時觸發(fā)錯誤。我們僅需在處理前進行檢測即可。
不過,這會引發(fā)另外一個問題:我們能否讓自定義類也擁有這個功能呢?回答是肯定的!第一個實現(xiàn)方法類似如下:
class MyTraversable implements Traversable { // 在這里編碼... }
如果我們執(zhí)行這個類,我們將看到一個錯誤信息:
PHP Fatal error: Class MyTraversable must implement interface Traversable as part of either Iterator or IteratorAggregateIterator(迭代器)
我們無法直接實現(xiàn) Traversable,但是我們可以嘗試第二種方案:
class MyTraversable implements Iterator { // 在這里編碼... }
這個接口需要我們實現(xiàn) 5 個方法。讓我們完善我們的迭代器:
class MyTraversable implements Iterator { protected $data; protected $index = 0; public function __construct($data) { $this->data = $data; } public function current() { return $this->data[$this->index]; } public function next() { return $this->data[$this->index++]; } public function key() { return $this->index; } public function rewind() { $this->index = 0; } public function valid() { return $this->index < count($this->data); } }
這邊我們需要注意幾個事項:
我們需要存儲構造器方法傳入的 $data 數(shù)組,以便后續(xù)我們可以從中獲取它的元素。
還需要一個內部索引(或指針)來跟蹤 current 或 next 元素。
rewind() 僅僅重置 index 屬性,這樣 current() 和 next() 才能正常工作。
鍵名并非只能是數(shù)字類型!這里使用數(shù)組索引是為了保證示例足夠簡單。
我們可以向下面這樣運行這段代碼:
$iterator = new MyTraversable(["foo", "bar", "baz"]); foreach ($iterator as $key => $value) { print "item: " . $key . "|" . $value . " "; }
這看起來需要處理太多工作,但是這是能夠像數(shù)組一樣使用 foreach/for 功能的一個簡潔實現(xiàn)。
IteratorAggregate(聚合迭代器)還記得第二個接口拋出的 Traversable 異常么?下面看一個比實現(xiàn) Iterator 接口更快的實現(xiàn)吧:
class MyIteratorAggregate implements IteratorAggregate { protected $data; public function __construct($data) { $this->data = $data; } public function getIterator() { return new ArrayIterator($this->data); } }
這里我們作弊了。相比于實現(xiàn)一個完整的 Iterator,我們通過 ArrayIterator() 裝飾。不過,這相比于通過實現(xiàn)完整的 Iterator 簡化了不少代碼。
兄弟莫急!先讓我們比較一些代碼。首先,我們在不使用生成器的情況下從文件中讀取每一行數(shù)據(jù):
$content = file_get_contents(__FILE__); $lines = explode(" ", $content); foreach ($lines as $i => $line) { print $i . ". " . $line . " "; }
這段代碼讀取文件自身,然后會打印出每行的行號和代碼。那么為什么我們不使用生成器呢!
function lines($file) { $handle = fopen($file, "r"); while (!feof($handle)) { yield trim(fgets($handle)); } fclose($handle); } foreach (lines(__FILE__) as $i => $line) { print $i . ". " . $line . " "; }
我知道這看起來更加復雜。不錯,不過這是因為我們沒有使用 file_get_contents() 函數(shù)。一個生成器看起來就像是一個函數(shù),但是它會在每次獲取到 yield 關鍵詞是停止運行。
生成器看起來有點像迭代器:
print_r(lines(__FILE__)); // Generator Object ( )
盡管它不是迭代器,它是一個 Generator。它的內部定義了什么方法呢?
print_r(get_class_methods(lines(__FILE__))); // Array // ( // [0] => rewind // [1] => valid // [2] => current // [3] => key // [4] => next // [5] => send // [6] => throw // [7] => __wakeup // )
如果你讀取一個大文件,然后使用 memory_get_peak_usage(),你會注意到生成器的代碼會使用固定的內存,無論這個文件有多大。它每次進度去一行。而是用 file_get_contents() 函數(shù)讀取整個文件,會使用更大的內存。這就是在迭代處理這類事物時,生成器的能給我們帶來的優(yōu)勢!Send(發(fā)送數(shù)據(jù))
可以將數(shù)據(jù)發(fā)送到生成器中??聪孪旅孢@個生成器:
current() . " "; // foo
注意這里我們如何在 call_user_func() 函數(shù)中封裝生成器函數(shù)的?這里僅僅是一個簡單的函數(shù)定義,然后立即調用它獲取一個新的生成器實例...
我們已經(jīng)見過 yield 的用法。我們可以通過擴展這個生成器來接收數(shù)據(jù):
$generator = call_user_func(function() { $input = (yield "foo"); print "inside: " . $input . " "; }); print $generator->current() . " "; $generator->send("bar");
數(shù)據(jù)通過 yield 關鍵字傳入和返回。首先,執(zhí)行 current() 代碼直到遇到 yield,返回 foo。send() 將輸出傳入到生成器打印輸入的位置。你需要習慣這種用法。
拋出異常(Throw)由于我們需要同這些函數(shù)進行交互,可能希望將異常推送到生成器中。這樣這些函數(shù)就可以自行處理異常。
看看下面這個示例:
$multiply = function($x, $y) { yield $x * $y; }; print $multiply(5, 6)->current(); // 30
現(xiàn)在讓我們將它封裝到另一個函數(shù)中:
$calculate = function ($op, $x, $y) use ($multiply) { if ($op === "multiply") { $generator = $multiply($x, $y); return $generator->current(); } }; print $calculate("multiply", 5, 6); // 30
這里我們通過一個普通閉包將乘法生成器封裝起來?,F(xiàn)在讓我們驗證無效參數(shù):
$calculate = function ($op, $x, $y) use ($multiply) { if ($op === "multiply") { $generator = $multiply($x, $y); if (!is_numeric($x) || !is_numeric($y)) { throw new InvalidArgumentException(); } return $generator->current(); } }; print $calculate("multiply", 5, "foo"); // PHP Fatal error...
如果我們希望能夠通過生成器處理異常?我們怎樣才能將異常傳入生成器呢!
$multiply = function ($x, $y) { try { yield $x * $y; } catch (InvalidArgumentException $exception) { print "ERRORS!"; } }; $calculate = function ($op, $x, $y) use ($multiply) { if ($op === "multiply") { $generator = $multiply($x, $y); if (!is_numeric($x) || !is_numeric($y)) { $generator->throw(new InvalidArgumentException()); } return $generator->current(); } }; print $calculate("multiply", 5, "foo"); // PHP Fatal error...
棒呆了!我們不僅可以像迭代器一樣使用生成器。還可以通過它們發(fā)送數(shù)據(jù)并拋出異常。它們是可中斷和可恢復的函數(shù)。有些語言把這些函數(shù)叫做……
我們可以使用協(xié)程(coroutines)來構建異步代碼。讓我們來創(chuàng)建一個簡單的任務調度程序。首先我們需要一個 Task 類:
class Task { protected $generator; public function __construct(Generator $generator) { $this->generator = $generator; } public function run() { $this->generator->next(); } public function finished() { return !$this->generator->valid(); } }
Task 是普通生成器的裝飾器。我們將生成器賦值給它的成員變量以供后續(xù)使用,然后實現(xiàn)一個簡單的 run() 和 finished() 方法。run() 方法用于執(zhí)行任務,finished() 方法用于讓調度程序知道何時終止運行。
然后我們需要一個 Scheduler 類:
class Scheduler { protected $queue; public function __construct() { $this->queue = new SplQueue(); } public function enqueue(Task $task) { $this->queue->enqueue($task); } pulic function run() { while (!$this->queue->isEmpty()) { $task = $this->queue->dequeue(); $task->run(); if (!$task->finished()) { $this->queue->enqueue($task); } } } }
Scheduler 用于維護一個待執(zhí)行的任務隊列。run() 會彈出隊列中的所有任務并執(zhí)行它,直到運行完整個隊列任務。如果某個任務沒有執(zhí)行完畢,當這個任務本次運行完成后,我們將再次入列。
SplQueue 對于這個示例來講再合適不過了。它是一種 FIFO(先進先出:fist in first out) 數(shù)據(jù)結構,能夠確保每個任務都能夠獲取足夠的處理時間。
我們可以像這樣運行這段代碼:
$scheduler = new Scheduler(); $task1 = new Task(call_user_func(function() { for ($i = 0; $i < 3; $i++) { print "task1: " . $i . " "; yield; } })); $task2 = new Task(call_user_func(function() { for ($i = 0; $i < 6; $i++) { print "task2: " . $i . " "; yield; } })); $scheduler->enqueue($task1); $scheduler->enqueue($task2); $scheduler->run();
運行時,我們將看到如下執(zhí)行結果:
task 1: 0 task 1: 1 task 2: 0 task 2: 1 task 1: 2 task 2: 2 task 2: 3 task 2: 4 task 2: 5
這幾乎就是我們想要的執(zhí)行結果。不過有個問題發(fā)生在首次運行每個任務時,它們都執(zhí)行了兩次。我們可以對 Task 類稍作修改來修復這個問題:
class Task { protected $generator; protected $run = false; public function __construct(Generator $generator) { $this->generator = $generator; } public function run() { if ($this->run) { $this->generator->next(); } else { $this->generator->current(); } $this->run = true; } public function finished() { return !$this->generator->valid(); } }
我們需要調整首次 run() 方法調用,從生成器當前有效的指針讀取運行。后續(xù)調用可以從下一個指針讀取運行...
有些人基于這個思路實現(xiàn)了一些超贊的類庫。我們來看看其中的兩個...
RecoilPHPRecoilPHP 是一套基于協(xié)程的類庫,它最令人印象深刻的是用于 ReactPHP 內核??梢詫⑹录h(huán)在 RecoilPHP 和 RecoilPHP 之間進行交換,而你的程序無需架構上的調整。
我們來看一下 ReactPHP 異步 DNS 解決方案:
function resolve($domain, $resolver) { $resolver ->resolve($domain) ->then(function ($ip) use ($domain) { print "domain: " . $domain . " "; print "ip: " . $ip . " "; }, function ($error) { print $error . " "; }) } function run() { $loop = ReactEventLoopFactory::create(); $factory = new ReactDnsResolverFactory(); $resolver = $factory->create("8.8.8.8", $loop); resolve("silverstripe.org", $resolver); resolve("wordpress.org", $resolver); resolve("wardrobecms.com", $resolver); resolve("pagekit.com", $resolver); $loop->run(); } run();
resolve() 接收域名和 DNS 解析器,并使用 ReactPHP 執(zhí)行標準的 DNS 查找。不用太過糾結與 resolve() 函數(shù)內部。重要的是這個函數(shù)不是生成器,而是一個函數(shù)!
run() 創(chuàng)建一個 ReactPHP 事件循環(huán),DNS 解析器(這里是個工廠實例)解析若干域名。同樣,這個也不是一個生成器。
想知道 RecoilPHP 到底有何不同?還希望掌握更多細節(jié)!
use RecoilRecoil; function resolve($domain, $resolver) { try { $ip = (yield $resolver->resolve($domain)); print "domain: " . $domain . " "; print "ip: " . $ip . " "; } catch (Exception $exception) { print $exception->getMessage() . " "; } } function run() { $loop = (yield Recoil::eventLoop()); $factory = new ReactDnsResolverFactory(); $resolver = $factory->create("8.8.8.8", $loop); yield [ resolve("silverstripe.org", $resolver), resolve("wordpress.org", $resolver), resolve("wardrobecms.com", $resolver), resolve("pagekit.com", $resolver), ]; } Recoil::run("run");
通過將它集成到 ReactPHP 來完成一些令人稱奇的工作。每次運行 resolve() 時,RecoilPHP 會管理由 $resoler->resolve() 返回的 promise 對象,然后將數(shù)據(jù)發(fā)送給生成器。此時我們就像在編寫同步代碼一樣。與我們在其他一步模型中使用回調代碼不同,這里只有一個指令列表。
RecoilPHP 知道它應該管理一個有執(zhí)行 run() 函數(shù)時返回的 yield 數(shù)組。RoceilPHP 還支持基于協(xié)程的數(shù)據(jù)庫(PDO)和日志庫。
IcicleIOIcicleIO 為了一全新的方案實現(xiàn) ReactPHP 一樣的目標,而僅僅使用協(xié)程功能。相比 ReactPHP 它僅包含極少的組件。但是,核心的異步流、服務器、Socket、事件循環(huán)特性一個不落。
讓我們看一個 socket 服務器示例:
use IcicleCoroutineCoroutine; use IcicleLoopLoop; use IcicleSocketClientClientInterface; use IcicleSocketServerServerInterface; use IcicleSocketServerServerFactory; $factory = new ServerFactory(); $coroutine = Coroutine::call(function (ServerInterface $server) { $clients = new SplObjectStorage(); $handler = Coroutine::async( function (ClientInterface $client) use (&$clients) { $clients->attach($client); $host = $client->getRemoteAddress(); $port = $client->getRemotePort(); $name = $host . ":" . $port; try { foreach ($clients as $stream) { if ($client !== $stream) { $stream->write($name . "connected. "); } } yield $client->write("Welcome " . $name . "! "); while ($client->isReadable()) { $data = trim(yield $client->read()); if ("/exit" === $data) { yield $client->end("Goodbye! "); } else { $message = $name . ":" . $data . " "; foreach ($clients as $stream) { if ($client !== $stream) { $stream->write($message); } } } } } catch (Exception $exception) { $client->close($exception); } finally { $clients->detach($client); foreach ($clients as $stream) { $stream->write($name . "disconnected. "); } } } ); while ($server->isOpen()) { $handler(yield $server->accept()); } }, $factory->create("127.0.0.1", 6000)); Loop::run();
據(jù)我所知,這段代碼所做的事情如下:
在 127.0.0.1 和 6000 端口創(chuàng)建一個服務器實例,然后將其傳入外部生成器.
外部生成器運行,同時服務器等待新連接。當服務器接收一個連接它將其傳入內部生成器。
內部生成器寫入消息到 socket。當 socket 可讀時運行。
每次 socket 向服務器發(fā)送消息時,內部生成器檢測消息是否是退出標識。如果是,通知其他 socket。否則,其它 socket 發(fā)送這個相同的消息。
打開命令行終端輸入 nc localhost 6000 查看執(zhí)行結果!
該示例使用 SplObjectStorage 跟蹤 socket 連接。這樣我們就可以向所有 socket 發(fā)送消息。
這個話題可以包含很多內容。希望您能看到生成器是如何創(chuàng)建的,以及它們如何幫助編寫迭代程序和異步代碼。
如果你有問題,可以隨時問我。
感謝 Nikita Popov(還有它的啟蒙教程 Cooperative multitasking using coroutines (in PHP!) ),Anthony Ferrara 和 Joe Watkins。這些研究工作澤被蒼生,給我以寫作此篇文章的靈感。關注他們吧,好么?原文
Co-operative PHP Multitasking
文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://systransis.cn/yun/29045.html
摘要:如果僅依靠程序自動交出控制的話,那么一些惡意程序將會很容易占用全部時間而不與其他任務共享。多個操作可以在重疊的時間段內進行。 PHP下的異步嘗試系列 如果你還不太了解PHP下的生成器,你可以根據(jù)下面目錄翻閱 PHP下的異步嘗試一:初識生成器 PHP下的異步嘗試二:初識協(xié)程 PHP下的異步嘗試三:協(xié)程的PHP版thunkify自動執(zhí)行器 PHP下的異步嘗試四:PHP版的Promise ...
摘要:消費者開發(fā)使用本例時,請確保你使用的編譯時開啟了本例我們采用的守護程序協(xié)程池來完成一個超高性能的郵件發(fā)送程序。 去年 Mix PHP V1 發(fā)布時,我寫了一個多進程的郵件發(fā)送實例: 使用 mixphp 打造多進程異步郵件發(fā)送,今年 Mix PHP V2 發(fā)布,全面的協(xié)程支持讓我們可以使用一個進程就可達到之前多個進程都無法達到的更高 IO 性能,所以今天重寫一個協(xié)程池版本的郵件發(fā)送實例。...
摘要:線程擁有自己獨立的棧和共享的堆,共享堆,不共享棧,線程亦由操作系統(tǒng)調度標準線程是的。以及鳥哥翻譯的這篇詳細文檔我就以他實現(xiàn)的協(xié)程多任務調度為基礎做一下例子說明并說一下關于我在阻塞方面所做的一些思考。 進程、線程、協(xié)程 關于進程、線程、協(xié)程,有非常詳細和豐富的博客或者學習資源,我不在此做贅述,我大致在此介紹一下這幾個東西。 進程擁有自己獨立的堆和棧,既不共享堆,亦不共享棧,進程由操作系...
摘要:本文先回顧生成器,然后過渡到協(xié)程編程。其作用主要體現(xiàn)在三個方面數(shù)據(jù)生成生產者,通過返回數(shù)據(jù)數(shù)據(jù)消費消費者,消費傳來的數(shù)據(jù)實現(xiàn)協(xié)程。解決回調地獄的方式主要有兩種和協(xié)程。重點應當關注控制權轉讓的時機,以及協(xié)程的運作方式。 轉載請注明文章出處: https://tlanyan.me/php-review... PHP回顧系列目錄 PHP基礎 web請求 cookie web響應 sess...
摘要:介紹是基于開發(fā)的協(xié)程開發(fā)框架,擁有常駐內存協(xié)程異步非阻塞等優(yōu)點。宇潤我在年開發(fā)并發(fā)布了第一個框架,一直維護使用至今,非常穩(wěn)定,并且有文檔。于是我走上了開發(fā)的不歸路 showImg(https://segmentfault.com/img/bVbcxQH?w=340&h=160); 介紹 IMI 是基于 Swoole 開發(fā)的協(xié)程 PHP 開發(fā)框架,擁有常駐內存、協(xié)程異步非阻塞IO等優(yōu)點。...
閱讀 1942·2021-11-24 09:39
閱讀 3526·2021-09-28 09:36
閱讀 3296·2021-09-06 15:10
閱讀 3453·2019-08-30 15:44
閱讀 1161·2019-08-30 15:43
閱讀 1806·2019-08-30 14:20
閱讀 2721·2019-08-30 12:51
閱讀 2042·2019-08-30 11:04