使用 Puppeteer 導(dǎo)出聲享 PPT

Codeing_ls 發(fā)布于2019-08-23 16:02 / 3470人閱讀

摘要：而打印所用的頁(yè)面需要用到用戶(hù)信息，所以我們登錄了一個(gè)超管帳號(hào)來(lái)執(zhí)行打印操作。在訪問(wèn)頁(yè)面的時(shí)候通過(guò)參數(shù)校驗(yàn)判斷是否是打印而打開(kāi)的頁(yè)面，如果是則登錄超管帳號(hào)。

現(xiàn)狀

聲享是一個(gè)基于 ThinkJS 開(kāi)發(fā)的在線(xiàn)制作 PPT 平臺(tái)。聲享制作的 PPT 支持代碼高亮、圖片上傳、神奇效果等功能，同時(shí)你可以在聲享收藏自己喜歡的 PPT 、對(duì)自己的 PPT 進(jìn)行分類(lèi)管理。其中有一個(gè) PDF 導(dǎo)出的功能，可以將自己制作的 PPT 導(dǎo)出成 PDF 保存到本地。

功能實(shí)現(xiàn)比較簡(jiǎn)單，只是提供了一個(gè)頁(yè)面，用戶(hù)需要手動(dòng)去打印成 PDF。這個(gè)方案存在一些問(wèn)題：

由于使用了 iframe 懶加載導(dǎo)致未加載的 iframe 無(wú)法正常顯示。

該種方案只能打印所有頁(yè)面的初始狀態(tài)。如果頁(yè)面中存在切換動(dòng)畫(huà)，可能會(huì)丟失部分 PPT 信息。

需要用戶(hù)手動(dòng)操作，提高了使用難度。

如果是前端來(lái)生成 PDF，這些問(wèn)題基本可以得到解決，但是開(kāi)發(fā)量比較大而且存在一個(gè)效率問(wèn)題。如果 PPT 頁(yè)面存在多個(gè) iframe，PDF 的生成時(shí)間過(guò)長(zhǎng)會(huì)讓用戶(hù)長(zhǎng)時(shí)間等待，明顯不太合適。最終還是決定服務(wù)端來(lái)生成 PDF，才有了后來(lái) Puppeteer 的嘗試。

Puppeteer

什么是Puppeteer呢？官方給的解釋是：

Puppeteer is a Node library which provides a high-level API to control Chrome or Chromium over the DevTools Protocol. Puppeteer runs headless by default, but can be configured to run full (non-headless) Chrome or Chromium.

簡(jiǎn)而言之，這貨是一個(gè)提供高級(jí) API 的 node 庫(kù)，能夠通過(guò) devtool 控制 headless 模式的 Chrome 或者 Chromium，它可以在 headless 模式下模擬任何的人為操作。通過(guò)它我們可以實(shí)現(xiàn)：

生成頁(yè)面的截圖或者 PDF。

抓取 SPA（單頁(yè)應(yīng)用）并生成預(yù)渲染內(nèi)容（即“SSR”（服務(wù)器端渲染））。

自動(dòng)提交表單，進(jìn)行 UI 測(cè)試，鍵盤(pán)輸入等。
...

通過(guò) Puppeteer，我們可以直接使用 Chrome 把我們需要的內(nèi)容導(dǎo)出為 PDF。對(duì)比以前的實(shí)現(xiàn)方式有以下優(yōu)點(diǎn)：

不需要用戶(hù)手動(dòng)操作，服務(wù)端生成 PDF 后直接以郵件的方式發(fā)送給用戶(hù)。

PPT 中的動(dòng)畫(huà)可以模擬用戶(hù)翻頁(yè)的動(dòng)作觸發(fā)，然后以初始、結(jié)束兩張 PDF 的方式展示，不會(huì)丟失 PPT 內(nèi)容。

不需要考慮圖片/ iframe 跨域等問(wèn)題。

可以說(shuō) Puppeteer 完美的解決來(lái)我們一期 PDF 導(dǎo)出存在的問(wèn)題。

解決方案

我們基本的實(shí)現(xiàn)思路是：

打開(kāi)一個(gè)正常的 PPT 播放頁(yè)，獲取需要打印的 DOM 元素并翻頁(yè) 。

重復(fù)第一步操作直至到最后一頁(yè) 。

清空頁(yè)面內(nèi)容并將前兩步獲得的頁(yè)面內(nèi)容依次填充到當(dāng)前頁(yè)面（為什么要依次填充會(huì)在后面解釋?zhuān)?/p>

對(duì)應(yīng)上述方案實(shí)現(xiàn)的部分代碼如下：

通過(guò) Puppeteer 打開(kāi)指定的頁(yè)面。

// 測(cè)試時(shí)建議headless設(shè)置為false，以便可以直觀看到頁(yè)面效果
this.browser = await puppeteer.launch({headless: this.isDebug});
this.page = await this.browser.newPage();
await this.page.goto("https://xxxxx.com", { waitUntil:"networkidle2" });

打開(kāi)頁(yè)面后可以通過(guò) Puppeteer 模擬用戶(hù)翻頁(yè)操作，每次翻頁(yè)后緩存需要打印的 DOM 元素字符串。

let canNext;
let i = 0;
const content = {};
do {
    canNext = await this.page.$(".navigate-right.enabled");
    const iframes = await this.page.$$(".PluginPage.present iframe").length;
    content[i++] = {
        iframe: iframes,
        domStr: await this.page.$eval(".RevealViewPort", el => el.outerHTML)
    }
    if (canNext) {
        await this.page.click(".navigate-right");
        // 等待翻頁(yè)動(dòng)畫(huà)
        await this.page.waitFor(1000);
    }
} while (canNext);

獲取到要打印的所有頁(yè)面 DOM 后，替換掉原來(lái)的頁(yè)面內(nèi)容。因?yàn)?$evaluate 方法中不支持調(diào)用外部變量所以只能以傳參的方式使用。

this.page.evaluate(domStr => document.body.innerHTML = domStr, content);

調(diào)用生成 PDF 的 API。

this.page.pdf({
    path: path.join(think.ROOT_PATH, "runtime/xxx.pdf"),
    format: "A4",
    landscape: true,
    printBackground: true //如果要顯示背景，此屬性要設(shè)置為true
})

使用 nodemailer 發(fā)送郵件給用戶(hù)。這一步如果想使用本地的 SMTP 服務(wù)請(qǐng)用 nodemailer 的 2.7.5 的版本，此版本后這項(xiàng)功能被刪除了。

let transporter = nodemailer.createTransport({
    host: "smtp.ym.163.com",
    port: 994,
    secure: true,
    auth: {
        user: "[email protected]",
        pass: "xxx"
    }
});
transporter.sendMail({
    from: "[email protected]",
    to: "[email protected]",,
    subject: "【聲享】xxx",
    attachments: [{
        filename: "xxx.pdf",
        path: path.join(think.ROOT_PATH, "runtime/xxx.pdf"),
        contentType: "application/pdf"
    }]
})

開(kāi)發(fā)中需要注意的問(wèn)題

用戶(hù)登錄

使用 Puppeteer 打開(kāi)頁(yè)面相當(dāng)于你新啟動(dòng)了一個(gè)瀏覽器實(shí)例，頁(yè)面中的 seession 和 cookie 是空的。而打印所用的頁(yè)面需要用到用戶(hù)信息，所以我們登錄了一個(gè)超管帳號(hào)來(lái)執(zhí)行打印操作。在 ThinkJS 中可以通過(guò)中間件來(lái)實(shí)現(xiàn)這項(xiàng)功能。在訪問(wèn)頁(yè)面的時(shí)候通過(guò)參數(shù)校驗(yàn)判斷是否是打印而打開(kāi)的頁(yè)面，如果是則登錄超管帳號(hào)。

// 打開(kāi)指定頁(yè)面時(shí)通過(guò)校驗(yàn)后面參數(shù)判斷是否以超管登錄
module.exports = options => {
    return async (ctx, next) => {
        const { token, ctime } = ctx.query;
        const md5Str = tockenGenerator();
        if (md5Str === token) {
            await ctx.session("userInfo", adminUser);
        }
        return next();
    };
};

Puppeteer 啟動(dòng)

如果服務(wù)端是運(yùn)行在 root 權(quán)限下，在啟動(dòng) Puppeteer 時(shí)要添加 --no-sandbox 參數(shù)，否則 Chrome/Chromium 會(huì)啟動(dòng)失敗。詳情見(jiàn) Running as root without — no-sandbox is not supported。這個(gè)權(quán)限問(wèn)題在linux以root用戶(hù)使用 Chrome 的時(shí)候同樣適用。

this.browser = await puppeteer.launch({args:["--no-sandbox"]});

iframe 無(wú)法加載

聲享支持頁(yè)面內(nèi)嵌入 iframe，在打印的時(shí)候碰到一個(gè)問(wèn)題。如果同時(shí)在頁(yè)面上插入 iframe 過(guò)多，后面的 iframe 會(huì)直接卡住不再加載。所以 iframe 最好分批插入或者一個(gè)一個(gè)插入，同時(shí)設(shè)定10秒來(lái)加載iframe。如果想精確控制 iframe 也可以使用 API 等待 iframe 完全加載再執(zhí)行后續(xù)操作。

for (let i = 0; i < pages.length; i++) {
    const page = pages[i];
    await this.page.$evaluate(content => {
        const divDom = document.createElement("div");
        divDom.innerHTML = content;
        document.body.appendChild(divDom.childNodes[0])
    }, page.domStr);
    if (page.iframe) await this.page.waitFor(10000 * page.iframe);
}

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/102645.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

Codeing_ls

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

pacificrack：VPS中秋促銷(xiāo)，$19.20/年，4核/4G/25G SSD/2.5T月流量

閱讀 2256·2021-09-24 10:31
買(mǎi)了虛擬主機(jī)怎么用-如何購(gòu)買(mǎi)虛擬主機(jī)？需要注意什么？

閱讀 3910·2021-09-22 15:16
三年前，我差點(diǎn)成了爬蟲(chóng)大師

閱讀 3426·2021-09-22 10:02
全國(guó)計(jì)算機(jī)等級(jí)考試二級(jí)Python（2021年9月）備考筆記第十二天

閱讀 1051·2021-09-22 10:02
計(jì)劃在2021年進(jìn)行響應(yīng)式開(kāi)發(fā)？但不確定應(yīng)該選擇哪種技術(shù)來(lái)快速且低成本的開(kāi)發(fā)應(yīng)用程序？一文給你解決問(wèn)

閱讀 1869·2021-09-08 09:36
H5手機(jī)端開(kāi)發(fā)問(wèn)題匯總及解決方案

閱讀 2020·2019-08-30 14:18
# 是的，是你的BFC - CSS中常用

閱讀 637·2019-08-30 10:51
六位字符密碼輸入器

閱讀 1896·2019-08-29 11:08

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

使用 Puppeteer 導(dǎo)出聲享 PPT

相關(guān)文章

**Node.js定時(shí)導(dǎo)出Highchart圖表**

**用純 DOM 的方式結(jié)合 Puppeteer 自動(dòng)生成網(wǎng)頁(yè)骨架屏**

手把手教你如何用Crawlab構(gòu)建技術(shù)文章聚合平臺(tái)(一)

手把手教你如何用Crawlab構(gòu)建技術(shù)文章聚合平臺(tái)(一)

Puppeteer 初探

發(fā)表評(píng)論

0條評(píng)論

Codeing_ls

男|高級(jí)講師

TA的文章

pacificrack：VPS中秋促銷(xiāo)，$19.20/年，4核/4G/25G SSD/2.5T月流量

買(mǎi)了虛擬主機(jī)怎么用-如何購(gòu)買(mǎi)虛擬主機(jī)？需要注意什么？

三年前，我差點(diǎn)成了爬蟲(chóng)大師

全國(guó)計(jì)算機(jī)等級(jí)考試二級(jí)Python（2021年9月）備考筆記第十二天

計(jì)劃在2021年進(jìn)行響應(yīng)式開(kāi)發(fā)？但不確定應(yīng)該選擇哪種技術(shù)來(lái)快速且低成本的開(kāi)發(fā)應(yīng)用程序？一文給你解決問(wèn)

H5手機(jī)端開(kāi)發(fā)問(wèn)題匯總及解決方案

# 是的，是你的BFC - CSS中常用

六位字符密碼輸入器

最新活動(dòng)

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

使用 Puppeteer 導(dǎo)出聲享 PPT

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！