jAutoPagerize / Bug in Safari
twitter とか、prototype.js をつかっているサイトだと Array#reduce がうわがきされるうえに挙動がちがっててうごかない。
こっちの prototype 拡張をやめる (関数よびだしにする) っていうの以外で解決できるならするけど、できないならやらない。
twitter とか、prototype.js をつかっているサイトだと Array#reduce がうわがきされるうえに挙動がちがっててうごかない。
こっちの prototype 拡張をやめる (関数よびだしにする) っていうの以外で解決できるならするけど、できないならやらない。
http://coderepos.org/share/changeset/2041
ごくごく簡単な XPath ジェネレータ/チェッカをくみこんでみました (Safari でのデバッグ用途が主目的)。siteinfo つくるなら基本的に http://labs.gmo.jp/blog/ku/2007/07/autopagerizexpath_autopagerize_ide.html をつかえばいいとおもうのでいらないと思います (さっきまで AutoPagerize IDE つかったことなかったw こりゃ便利ですね><)。
jAutoPagerize のアイコンをクリックするとテキストエリアがでます。Inspect ボタンをおすと要素選択して XPath を生成します。テキストエリア編集すると選択ノードにアウトラインがつきます。Safari でも動きます。jAutoPagerize のアイコンが表示されてないところでは javascript:XPathGenerator.open(); するとでてきます。
ノードから XPath つくるやつはちょー簡単に生成するのを前書いていたらしくて (test.user.js で getXPath... までうちこんだら autocompletepop された……) それをちょい改善してつかいました (ほとんどテストしてないからバグってるかも)。
getXPathByElement : function (target) {
var pathElement = "";
var node = target;
if (node.nodeType == 9 /*DOCUMENT_NODE=9*/) {
return ""
} else {
var tagName = node.tagName.toLowerCase();
if (node.hasAttribute("id")) {
// pathElement = tagName + '[@id="'+node.getAttribute("id")+'"]';
pathElement = 'id("'+node.getAttribute("id")+'")';
} else {
pathElement = arguments.callee(node.parentNode) + '/' + tagName;
if (node.hasAttribute("class")){
pathElement += '[@class="'+node.getAttribute("class")+'"]';
} else {
pathElement += '['+indexOf(node)+']';
}
}
}
return pathElement;
function indexOf (node) {
for (var i = 0, r = 1, c = node.parentNode.childNodes, len = c.length; i < len; i++) {
if (c[i].nodeName == node.nodeName &&
c[i].nodeType == node.nodeType) {
if (c[i] == node) return r;
r++;
}
}
return -1;
}
}
Ruby にしても JS にしても $1 $2 は、それらがどっから沸いてきたのかソースコードをうえからよんでいったときにわかりにくいので、できるだけ使たくない。暗黙的に代入されているし、$1 $2 っていう名前には全くマッチを連想させない (慣れればわかるけど……あと JS の場合は RegExp.$1 とかになるのでいくぶんマシ)。しかも $0 は実行中のプロセス名だから $0 と $1 の間に同じ $n なのに全く関連がない。
よっぽどめんどくさくない限りは Regexp.last_match したり m = str.match(r); する。(Perl のときは気にしない)
GreaseKit だと同じウィンドウで userjs が実行されるので、常に prototype 上書きされる危険性があって、これはどうしよもない。普通は標準の関数をわざわざうわがきしたりしないから問題ないけど、前述の Array#reduce みたいに、微妙な立場の関数でしかも名前がよくつかわれるやつは上書きされやすい。(というか実際には Array#map も上書きされているけど、こっちは挙動が同じなので問題になってないだけ)
Opera もたぶん同じウィンドウで実行されるから同じ問題をもっていると思うけど、あんまり調べてない。
解決法:
あとたぶんこういう関係 (unsafeWindow的な意味で) jAutoPagerize + Safari + GreaseKit だと XSS ふんでそうな感じがするのでチェック必要だと思う。(ちょっと考えたけどとれちゃうな…… http://coderepos.org/share/changeset/2050 修正した。ほかにもある予感……)
(Greasemonkey だとウィンドウが別れているのでだいだい問題おきない。なぜ unsafeWindow が GM にはあって、他のにはないのかをよく考えて使わないとだめですね><)
あれ r2050 じゃ解決になってないよね…… siteinfo を外からアクセスできるようにしたらだめだな。
r2051 でたぶん解決。Safari でつかうのは危険なかおりがプンプンする。
nanto_vi さんのコメントで原因が判明したので試行錯誤してコミットした。
http://coderepos.org/share/changeset/2053
var x = new XSLTProcessor();
var t = [
"<xsl:stylesheet version='1.0' xmlns:xsl='http://www.w3.org/1999/XSL/Transform'>",
"<xsl:output method='html'/>",
"<xsl:template match='/'>",
"<html><head><title>", title, "</title></head><body/></html>",
"</xsl:template>",
"</xsl:stylesheet>",
].join("");
var d = document.implementation.createDocument("", "nice-boat", null);
var r = d.createRange();
r.selectNodeContents(d.documentElement);
d.documentElement.appendChild(r.createContextualFragment(t));
x.importStylesheet(d.documentElement.firstChild);
var ret = x.transformToDocument(d);
なんかしばらく新しく siteinfo をとりにいってキャッシュするところがうごいてなかったっぽい。なおした。
でも Safari だといまいち挙動不審で、たまにsiteinfo 全部 ({}) になってしまうことがある。textarea.replace(//, function () {}) がへんなのかも……めんどい
uneval を適当に実装してテストしてたらきづいた。
position: absolute で段組されてるところだと document.documentElement.scrollHeight がすごく小くなってしまい、ページがどのぐらい残っているか取得できない。
あと GM_xmlhttprequest をつかうべきじゃないかも。ページングがクロスサイトすることなんてまずないし、無用な特権は行使しないほうがいいよね。
userChrome.js + http://www.ne.jp/asahi/nanto/moon/2006/12/31/copy-url-lite.uc.js + Firebug
{
label: "Copy XPath",
accesskey: "X",
get text () {
return FBL.getElementXPath(document.popupNode);
}
}をつけたして C-n して新しいウィンドウを開く /html/body/div[2]/div[2]/form/div/textarea
ただし、Fx の場合 thead とかが存在しなくても DOM 上では thead を補完するので、そのままでは他のブラウザでとおらないこともあるとおもう (Google のページングとかそうだけど AutoPagerize 的なときに困るのでちゃんと確認してほしい)。
http://d.hatena.ne.jp/keisukefukuda/20071126/p1
Perl と同じように (つまり libxml そのまま) ではありませんが以下のようにしてできます。
require "rubygems"
require "xml/libxml"
require "tempfile"
f = Tempfile.new("xml")
f << <<EOS
<?xml version="1.0" encoding='utf-8'?>
<service xmlns="http://www.w3.org/2007/app"
xmlns:atom="http://www.w3.org/2005/Atom">
<workspace>
<atom:title>Main Site</atom:title>
<collection href="http://example.org/blog/main">
<atom:title>My Blog Entries</atom:title>
<categories href="http://example.com/cats/forMain.cats" />
</collection>
</workspace>
</service>
EOS
f.close
doc = XML::Document.file(f.path)
namespaces = {
"app" => "http://www.w3.org/2007/app",
"atom" => "http://www.w3.org/2005/Atom"
}.to_a
p doc.find('/app:service/app:workspace/app:collection/atom:title', namespaces)
#=> <atom:title>My Blog Entries</atom:title>namespaces にわたすのが配列なのが微妙にひっかかる。(ドキュメントよむと "prefix:uri" みたいな文字列でもわたせるけど圧倒的なキモさなので使わないとおもう)
Ruby のブロックは実のところ proc {} を引数に渡すのを、その proc が一つの場合に限って簡略化して書けるだけなのだけど (実際はちょっと違うっぽいけど)、これがかなりうまくいってるのがおもしろいなぁ。
ってのはすごく重要だなぁ。
class TrueClass
def then
@ret = yield
self
end
def else
self
end
end
class FalseClass
def then
self
end
def else
@ret = yield
self
end
end
(foo == bar).then {
puts "hoge"
}.else {
puts "fuga"
}ふつうに綺麗に書ける。
Boolean.prototype.then = function (fun) {
// this は Object になっているので true になってしまう。
// もとの値をとりだすために valueOf()
if (this.valueOf()) fun();
return this;
};
// else は予約語なのでつかえない
Boolean.prototype.els = function (fun) {
if (this.valueOf()) fun();
return this;
};
("foo" == "bar").then(function () {
print("hoge");
}).els(function () {
print("fuga");
});ぜんぜん綺麗じゃない。
ちなみに Io だと if([pred], [then], [else]) 以外にもうえのと同じことがデフォでできる。(Io では引数は基本的に評価されない。Message オブジェクトとしてメソッドにわたる。ただし仮引数を書いた場合は自動で評価される)
("foo" == "bar") then (
"hoge" println
) else (
"fuga" println
). ではなくスペースをメッセージ送信のくぎりにすることはこういうところで生きてきますね。一見したら構文にしか見えない。(if は then/else の評価されたほうの値をかえすけど、else は nil をかえす。then はもちろん self をかえしている)