成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

UTF-8 Validation

Kahn / 3473人閱讀

摘要:題目鏈接這道題關鍵是搞懂題目意思。思路及代碼知道意思之后,這道題就很簡單了。一個,每次分三步來做,是每次都是新的統(tǒng)計后位里面,從前開始有多少個,用變量來保存,其中可能的值只有從開始檢查,后八位中的前兩位是否為,一共檢查更新的值為

UTF-8 Validation

題目鏈接:https://leetcode.com/problems...

這道題關鍵是搞懂題目意思。

UTF-8

1 byte: characters from 0 to 127 == ASCII
2 bytes: characters from 127 to 2047
3 bytes: characters from 2048 to 65535
4 bytes: characters from 65536 to 1112064

The leading bits tell: the length of the bytes

1 byte: the 1st bit is 0

2 bytes:

1st byte: start with "110"

2nd byte: start with "10"

3 bytes:

1st byte: start with "1110"

2nd byte: start with "10"

3rd byte: start with "10"

4 bytes:

1st byte: start with "11110"

2nd byte: start with "10"

3rd byte: start with "10"

4th byte: start with "10"

思路及代碼

知道意思之后,這道題就很簡單了。
一個loop,每次分三步來做,loop invariant是每次data[i]都是first byte of 新的character

統(tǒng)計data[i]后8位里面,從前開始有多少個1,用變量ones來保存,其中ones可能的值只有0, 2, 3, 4

從 data[i+1] 開始檢查,后八位中的前兩位是否為"10",一共檢查ones - 1

更新i的值為 i + ones

public class Solution {
    public boolean validUtf8(int[] data) {
        /* 1. check how many "1"s = ones
         * 2. check (i + 1, i + ones - 1) for "10"
         * 3. update i = i + ones
         * valid ones: 0, 2, 3, 4
         */
        int i = 0;
        while(i < data.length) {
            // 1. find ones
            int ones = 0;
            while(((data[i] >> (7 - ones)) & 1) == 1) {
                ones++;
            }
            // invalid ones 
            if(ones == 1 || ones > 4) return false;
            // 2. check 1s
            i++;
            while(ones-- > 1) {
                if(i >= data.length || ((data[i] >> 6) & 3) != 2) return false;
                // 3. update i
                i++;
            }
        }
        
        return true;
    }
}

Advantage of UTF-8

implement Unicode: encode different symbols(Chinese...)

web pages are often coded in UTF-8, XML, JSON

only use binary representation: 0 and 1

endianness independent

Disadvantage of UTF-8

space: use more bytes, larger

time: calculate

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉載請注明本文地址:http://systransis.cn/yun/66554.html

相關文章

  • [LintCode] UTF-8 Validation

    Problem A character in UTF8 can be from 1 to 4 bytes long, subjected to the following rules: For 1-byte character, the first bit is a 0, followed by its unicode code.For n-bytes character, the first n...

    tolerious 評論0 收藏0
  • leetcode393. UTF-8 Validation

    摘要:題目要求檢驗整數(shù)數(shù)組能否構成合法的編碼的序列。剩余的字節(jié)必須以開頭。而緊跟其后的字符必須格式為。綜上所述單字節(jié)多字節(jié)字符的跟隨字節(jié)兩個字節(jié)的起始字節(jié)三個字節(jié)的起始字節(jié)四個字節(jié)的起始字節(jié)下面分別是這題的兩種實現(xiàn)遞歸實現(xiàn)循環(huán)實現(xiàn) 題目要求 A character in UTF8 can be from 1 to 4 bytes long, subjected to the followin...

    Cruise_Chan 評論0 收藏0
  • 記錄_使用JSR303規(guī)范進行數(shù)據(jù)校驗

    摘要:時間年月日星期三說明使用規(guī)范校驗接口請求參數(shù)源碼第一章理論簡介背景介紹如今互聯(lián)網項目都采用接口形式進行開發(fā)。該規(guī)范定義了一個元數(shù)據(jù)模型,默認的元數(shù)據(jù)來源是注解。 時間:2017年11月08日星期三說明:使用JSR303規(guī)范校驗http接口請求參數(shù) 源碼:https://github.com/zccodere/s... 第一章:理論簡介 1-1 背景介紹 如今互聯(lián)網項目都采用HTTP接口...

    187J3X1 評論0 收藏0
  • Bean Validation完結篇:你必須關注的邊邊角角(約束級聯(lián)、自定義約束、自定義校驗器、國際

    摘要:和上標注的約束都會被執(zhí)行注意如果子類覆蓋了父類的方法,那么子類和父類的約束都會被校驗。 每篇一句 沒有任何技術方案會是一種銀彈,任何東西都是有利弊的 相關閱讀 【小家Java】深入了解數(shù)據(jù)校驗:Java Bean Validation 2.0(JSR303、JSR349、JSR380)Hibernate-Validation 6.x使用案例【小家Spring】Spring方法級別數(shù)據(jù)校...

    niuxiaowei111 評論0 收藏0
  • eclipse定制化配置調優(yōu)、初始化配置指南、可以解決啟動慢等問題

    摘要:配置的參數(shù)打開根目錄下的在最后面加上如下的參數(shù)測試環(huán)境位內存雙核測試版本經測試,啟動速度比默認配置有所提升,占用內存也較少其中這三行為啟用方式,不能保證在不同環(huán)境下都是最優(yōu)配置,可以替換為多核和大內存建議使 配置eclipse的jvm參數(shù) 打開eclipse根目錄下的eclipse.ini在最后面加上如下的jvm參數(shù) -Xms400m -Xmx1400m -XX:NewSize=128...

    Warren 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<