Právě se mě kamarád na MSN zeptal, že na jeho stránce je mnoho prázdných znaků, a když jsem otevřel zdrojový soubor, zjistil jsem, že kód je velmi řídký. Přišlo mu to zbytečné a řekl, že existuje způsob, jak se jich zbavit. Zeptal jsem se ho: "Je vaše stránka komprimovaná pomocí GZip?" Řekl, že ho použil, tak jsem odpověděl: "Pak nemusíte odstraňovat prázdné znaky, souvislé mezery jsou dobře stlačené a efekt po jejich odstranění není moc." V té době jsem si nemohl pomoct, ale myslel jsem si, že ráno je také sekce "Optimalizace domovské stránky blogového parku", která se zabývá "odstraňováním mezer a prázdných řádků v HTML", takže jsem ji chtěl vyzkoušet, abych zjistil, jak účinné je odstranění bílých mezer.
"Optimalizace domovské stránky Blog Parku":Přihlášení k hypertextovému odkazu je viditelné.
Mým experimentálním cílem jsou detailní stránky prvních 40 článků na mém blogu, které se pohybují od 98K do 277K před kompresí, což je podle mě typická velikost stránky v blogové zahradě. Používám testovací kód takto:
V uvedeném kódu jsem použil metodu odstranění bílých znaků z Bloggarden a výsledek je následující:
| Původní stránka | Původní stránka (zkomprimovaná) | Po vyjmutí prázdných nábojů | After Blank (komprimované) | Před a po vyjmutí prázdných nábojů | Před a po blankování (komprese) | | 130760 | 36018 | 117354 | 34702 | 13406 | 1316 | | 255935 | 63406 | 240433 | 61870 | 15502 | 1536 | | 278871 | 86794 | 263704 | 85298 | 15167 | 1496 | | 221248 | 53148 | 205440 | 51548 | 15808 | 1600 | | 151612 | 40260 | 137939 | 38940 | 13673 | 1320 | | 135019 | 36000 | 121593 | 34750 | 13426 | 1250 | | 128239 | 36230 | 114658 | 34878 | 13581 | 1352 | | 161530 | 42776 | 147189 | 41392 | 14341 | 1384 | | 99884 | 28372 | 87047 | 27084 | 12837 | 1288 | | 173534 | 43724 | 158446 | 42272 | 15088 | 1452 | | 191519 | 50398 | 176958 | 48888 | 14561 | 1510 | | 176996 | 40274 | 162706 | 38978 | 14290 | 1296 | | 206348 | 47362 | 191400 | 45964 | 14948 | 1398 | | 137014 | 38608 | 122855 | 37076 | 14159 | 1532 | | 144715 | 37260 | 131097 | 35748 | 13618 | 1512 | | 146531 | 36704 | 132619 | 35302 | 13912 | 1402 | | 199915 | 49224 | 182227 | 47452 | 17688 | 1772 | | 106929 | 29850 | 93690 | 28518 | 13239 | 1332 | | 136264 | 36664 | 121548 | 34990 | 14716 | 1674 | | 148750 | 37990 | 134567 | 36578 | 14183 | 1412 | | 282886 | 71924 | 266336 | 70306 | 16550 | 1618 | | 176099 | 41468 | 161322 | 40126 | 14777 | 1342 | | 108394 | 30456 | 95428 | 29216 | 12966 | 1240 | | 152578 | 40186 | 138543 | 38866 | 14035 | 1320 | | 230243 | 59970 | 215389 | 58554 | 14854 | 1416 | | 251183 | 57156 | 234862 | 55694 | 16321 | 1462 | | 196957 | 48176 | 181608 | 46776 | 15349 | 1400 | | 172267 | 41340 | 158105 | 40056 | 14162 | 1284 | | 265877 | 63650 | 248974 | 62142 | 16903 | 1508 | | 147403 | 38894 | 133751 | 37492 | 13652 | 1402 | | 149091 | 36460 | 134998 | 35190 | 14093 | 1270 | | 167741 | 43200 | 153614 | 41856 | 14127 | 1344 | | 171564 | 40898 | 157333 | 39648 | 14231 | 1250 | | 125812 | 34570 | 111047 | 33200 | 14765 | 1370 | | 190649 | 46524 | 175197 | 45040 | 15452 | 1484 | | 153807 | 39462 | 139401 | 38054 | 14406 | 1408 | | 120788 | 32228 | 107534 | 30930 | 13254 | 1298 | | 163327 | 41110 | 148763 | 39710 | 14564 | 1400 | | 103101 | 29476 | 90284 | 28222 | 12817 | 1254 | | 141384 | 39784 | 126641 | 38350 | 14743 | 1434 |
Stojí za to věnovat pozornost posledním dvěma sloupcům, ze kterých lze zjistit, že ačkoliv lze počet stran zmenšit o více než tucet K před a po odstranění prázdných míst, alePo kompresi je rozdíl ve skutečnosti jen 1-2K – asi 1-2 pakety。 Stojí tyto úspory za to? Navíc Blog Garden má tendenci nahrazovat obsah každé stránky regulárními výrazy, takže stojí to za tu cenu? Je na blogové zahradě, aby se sama profilovala......
A nakonec, odstranění mezerových znaků není tak jednoduché. Nejjednodušší příklad je: Narazili jste někdy na HTML editory nebo RSS čtečky, které převedou jinak čistý kód na řádek v článku? Je to proto, že libovolně odstraní veškerý mezerový prostor, ale zapomněli na HTML tag nazvaný <pre/>......
|