2025年3月 この範囲を時系列順で読む この範囲をファイルに出力する
🍔Re:5055◆その適用順序は半分(前半が)間違っていますのでご注意下さい。robots.txtでクローラーをブロックすると検索避けができなくなる点は、Google自身が公式ヘルプで明言しています。(「インデックスに登録してはいけない」という指示自体が読めなくなるため)
robots.txt ファイルでページのクロールが許可されていない場合、インデックス登録や表示に関するルールについての情報は検出されず、その結果無視されます。
後半の「metaタグ→それでも読まないお行儀悪いものは.htaccess」は正しい順序ですが、最初に「まずはrobots.txtを読んでもらう」とすると、Googleでは検索避けに失敗します。(※robots.txtでGoogle等の紳士的なクローラーをブロックしていないなら問題ありませんが。)
🍔Re:5053◆Googleに関してはその通りです。.htaccessでブロックしてもいけないし、robots.txtでブロックしてもいけません。なぜなら、ブロックされると「登録するな」という指示自体も読めないからです。
- もちろん、robots.txtでブロックされているならクローラーはページの内容を読みませんから、(ページ内に何が書かれているのかの情報は得られないため)インデックスに登録される可能性は減りはします(※なので「この方法で検索避けは成功する」と思えるケースもあるでしょう)。
- しかし、登録禁止だという指示自体も伝わっていないため、よほど評価値の高い外部サイトからリンクされている場合などの外部要因次第では(リンク元ページにあるリンクテキストなどのように「読むことを禁止されていない場所にある情報」を用いて)インデックスに登録される可能性が残ります。
※2000年代からある古典的な話ですが、「出口」という検索語でググると、Yahoo! Japanがヒットします。これは「出口」というリンクテキストを使ってYahoo!にリンクしているサイトが多いことによる影響です。つまり、「どんなリンクテキストを使ってリンクされているのか」という情報も検索サイトに反映される(要素の1つになる)のです。なので、robots.txtでページの中身を読むことだけを禁止しても(&.htaccessでページ自体を読めなくしても)、インデックスに登録される可能性はあります。
したがって、インデックス登録を避けるには、ページそのものに書かれた登録禁止の指示を確実に読ませる必要があるため、ブロックしてはいけないのです。
……とはいえ、世の中に存在するクローラーはGoogleやBingのような比較的紳士的に動作するものだけではありません(※検索のシェアはGoogleが1強ですが)。metaタグの存在を無視してインデックスに登録しようとするクローラーも存在するでしょう。なので、metaタグを読まないような無作法なクローラーに対しては、何らかのブロックをするほかありません。(そのような無作法なクローラーはrobots.txtだって読まないでしょうから、.htaccessでサーバ側に応答を拒否させるしかないでしょう。)
したがって、検索避けを厳密にしたいなら、以下のような方策が必要です。
- まずは、metaタグを読ませる。(←紳士的なクローラーはこの指示に従うので、まずはこれを確実に読ませる必要がある。)
- (次に、metaタグを無視するようなBotだけに限定して、robots.txtでブロックする。)
- 最後に、1も2も無視するようなBotだけに限定して、.htaccessでブロックする。
この順序を逆にしてしまうと(=あらゆるクローラーを.htaccessでブロックすると)、そもそもmetaタグを書く意味がなくなってしまいますから注意して下さい。なぜなら『あらゆるクローラーがmetaタグを読めなくなる』からです。
Googleだけを対象にするなら、そもそもmetaタグだけで充分です。他の無作法なBotも対象にしたい場合は、「Googleのような紳士的なクローラーにはアクセスを許可しつつ、無作法なクローラーだけを拒否するような .htaccessを書く」必要があります。
※なお、robots.txt自体に意味がないわけではありません。検索サイト以外のクローラー(最近ではAI学習用のBotも多いですね)をブロックする用途や、「クロールそのものは許可したいがクロール頻度を低く抑えたい(=負荷軽減)」場合などの指示には役立ちます。
とはいえ、Googleはrobots.txtに書かれた「クロール頻度の指示」は無視するんですけども……。┌(:3」└)┐
🍔Re:5054◆その場合は、2つの方法があります。
- 『サイトマップページモードをカテゴリ限定で表示させたページ』をiframeで読み込んで並べるページを作る。
- 『サイトマップページモードをカテゴリ限定で表示させたページ』の中身をJavaScriptで読み込んで1ページに合成するページを作る。
せっかく検索避けしているのに意味がないかもしれないと知って焦っていたので、少し落ち着けました。冷静に対処していきます。
なんでもかんでも.htaccessで弾いてしまうと、robots.txtやmetaタグを読んでくれるbotには意味がなくなってしまうよ、ということではないかと思います。.htaccessで弾きつつ、robots.txtだけはアクセス許可するとかもできますよ。調べればそれぞれ出てくるかと…
5051です。
サイトマップページモードを使うと、②③④ができるんですね!!
①もTODOリストに入れてくださりありがとうございます!!
ただ、私は「カテゴリAに属する記事の一覧のかたまり」と「カテゴリBに属する記事の一覧のかたまり」を同じページ上に並べたかったので新着投稿リストを使っていたのですが、サイトマップページモードの機能でもそのようなことはできますか…?
つまりまとめると、検索避けはhtmlのmeta要素のみ使うべきで、.htaccessやrobots.txtは使ってはいけない(併用も不可)ということでしょうか?
読解力がなく、頭の悪い質問で申し訳ないのですが、重要なところなので詳細を知りたいです。
🍕Re:5051◆目次は「サイトマップページモード」をご使用下さい。サイトマップページモードは、名称を「目次モード」にしておく方が良かったかな、と思うくらい、元々目次用途に作ったモードです。
このモードを使えば、ご要望の②・③・④は既に実現できます。
- ②そのカテゴリのカテゴリ名と概要文は、スキン内で現在カテゴリ情報要素を使えば表示できます。
- ③投稿内に含まれるハッシュタグの抽出表示は、投稿本文関連要素(オプション)の抽出結果を挿入(ハッシュタグ)を使えば実現できます。
- ④カテゴリごとに表示される投稿件数の変更は、てがろぐ Ver 4.5.3βで搭載した『カテゴリごとに「1ページあたりの表示件数」を別設定できる機能』を使えば実現できます。(※ここでの設定値は、通常の表示モードだけでなく、サイトマップページモードでも有効です。)
とてもお世話になっています、にししさんありがとうございます~!
新着投稿リストについて相談させてください。
私はてがろぐで小説サイトを作っていて、目次を作るのに新着投稿リストを使っています。(画像A)

そこで、#要望 が4つあるのですが、
①新着投稿リストで指定したカテゴリにおいて、同カテゴリに限定した隣接投稿へ移動できるリンクが表示されるようにしてほしい

②新着投稿リストで指定したカテゴリにおいて、そのカテゴリのカテゴリ名と概要文が表示されるようにしてほしい

③新着投稿リスト内に、その投稿内に含まれるハッシュタグが表示されるようにしてほしい

④新着投稿リストごとに表示される投稿の件数を変更できるようにしてほしい

お忙しいところ申し訳ないのですが、ご検討いただき、TODOリストの端っこに加えていただけると嬉しいです!
よろしくお願いします!!畳む
☕Re:5049◆検索避けには、まさしくそのmeta要素を使う必要があります。
.htaccessやrobots.txtを使ってクローラーからのアクセスをブロックしてしまうと、「検索インデックスに登録するな」という指示そのものが読めなくなるので、結果として検索避けに失敗します。(他サイトからのリンクを経由してクローラーが来た場合、そのページに書かれている情報は読めないため取得されませんが、リンク元ページにあるリンクラベル等を使ってインデックスに登録される可能性があります。)
なので、検索避けのためには「『登録するな』という指示(<meta name="robots" content="noindex">)自体はクローラーにも読めるように」しておく必要があります。
※参考:このGoogle検索セントラルHelpページ末尾の「robots.txt ルールとインデックス登録および表示に関するルールとの組み合わせ」項目には、「クロール禁止の情報自体が読めなかったら、指示は無視されるよ」的なことが書いてあります。
なお、IPアドレスは明確に対象国が分割されているわけではありません。「今は日本国内に割り当てられているIPアドレスが、来月は海外で使用されている」というケースもあり得ます(もちろんその逆も)。なので、IPアドレスを使ってアクセス元を判断するには常に最新の情報にアップデートし続ける必要があり、個人ではあまり現実的ではなさそうに思います。
少しになることがありまして、現在サイト内全てのページに検索避けのmetaタグを導入しているのですが、その場合は一つ目の『日本国外からのアクセスを制限する.htaccess』を使用した方がいいのでしょうか?
まだ今週末はまた寒くなるっぽい予報ですけども。
🌸Re:5047◆なるほど。
普通の半角「 # 」記号は、Unicodeで U+0023 で、
キーキャップ化した「 #️⃣ 」は、UnicodeでU+0023 U+FE0F U+20E3 なのでそういう動作になるんですね。
- U+0023 : #
- U+FE0F : (Emoji Variation Selector)
- U+20E3 : (Combining Enclosing Keycap)
- #️⃣ ← # + U+FE0F + U+20E3
- 1️⃣ ← 1 + U+FE0F + U+20E3
- 9️⃣ ← 9 + U+FE0F + U+20E3
最初の例では、『 #️⃣これってハッシュタグになる…?』の先頭はあくまでも「 # 」で、その続きが「 U+FE0F、 U+20E3、こ、れ、っ、て…… 」になるので、『U+FE0F (Emoji Variation Selector)』から「?」までがハッシュタグだと認識されると。
U+FE0F と U+20E3 は半角文字の範囲に含まれていないので、U+FE0F から ? までを一連のハッシュタグだと認識するんですね。
次の2つの例では、先頭の「 # 」と「 [ 」や「 - 」とにある U+FE0F U+20E3 だけがハッシュタグだと認識されるので、「 #️⃣ 」だけがクリックできるわけですね。^^;
※ハッシュタグを角括弧で囲む場合は、「 # 」と「 [ 」記号が連続している必要がありますが、ここではその間に U+FE0F U+20E3 が含まれていますから、連続していません。
※隠れハッシュタグとして扱う場合は、「 # 」と「 - 」記号が連続している必要がありますが、ここではその間に U+FE0F U+20E3 が含まれていますから、連続していません。
とりあえず、「 # 」の後に U+FE0F が続いている場合はハッシュタグにしないような仕様が必要でしょうね。(^_^;)
#️⃣[これってハッシュタグになる…?]
#️⃣-[これってハッシュタグになる…?]
#これはならない
パエリアには、まさしくそれ用の絵文字が定義されているのか……。🥘🥘🥘
……と思ったけども、Unicodeでの定義の名称は SHALLOW PAN OF FOOD(浅い鍋の食べ物)なので環境によってはパエリアとは限らないかもしれない……?
🥘Re:5042◆反応ありがとうございます。需要がありそうだと分かってありがたいです。^^
🥘Re:5043◆計画はしましたが、どうなるかは作ってみないと分からないので、気長にお待ち下さい~。^^;
🥘Re:5044◆日本国内に割り当てられているIPアドレスからのみ閲覧を許可するには、『日本国外からのアクセスを制限する.htaccess』を使うと良さそうです。ただし、検索サイトのクローラーはたいてい海外から来ますので、それを弾きたくない場合は、このページの『5.Apache「.htaccess」設定』を参考にすると良いです。
ただ、国内のユーザが必ず日本に割り当てられているIPアドレスから来るとは限りませんし、海外からのアクセスが必ずしもそれ以外のIPアドレスから来るとは限らない(VPNもありますし)点や、海外に住んでいる日本人もブロックしてしまう点にもご注意下さい。たぶん、「国内/国外」ではなく、本当に弾きたいものに限定して弾く方が望ましいと思います。
- なお、てがろぐには「高頻度アクセス制限機能 (迷惑Bot対策機能)」を用意していますので、ご活用下さい。(使うには事前準備が必要です。)
- また、管理画面への不正ログインを警戒する場合は、「ログインセキュリティ関連機能」もありますのでご活用下さい。(一部はデフォルトで有効になっています。)
様々なセキュリティ面等を考え、日本国内のみのアクセス可能という機能が欲しいです。ご検討くださいますと幸いです。
私もお待ちしております〜〜
web拍手本家はさすがにもう古く色々心配(主にセキュリティ)なため、使いたくても使えず困っていたので、本当にありがたいです。楽しみにしています!
🌸Re:5037◆β版のご試用をありがとうございます。No.4389でご要望頂いてから11ヶ月経っていましたね。^^; お役に立ったようで良かったです。(╹◡╹)
🌸Re:5039◆いいねボタン機能は、「てがろぐアドオンとしても使えて、単独でも使える、汎用Web拍手(いいねボタン)ツール」として開発しようかと計画しています。すごくうまく行ったとして、6月頃に最初のβ版が出せるといいな……と、なんとなく思ってはいます。^^; とりあえず、開発はする予定です。もうしばらく(数ヶ月)お待ち下さい~。(とはいえ、初回のβ版からいろいろ機能を盛るわけではないので、本格的に活用できるようになるにはもっとかかるかもしれませんが。)
ありがとうございます
https://tegalog.oita-pikapika.net
そこでご要望なのですが、てがろぐにいいねボタンを標準実装していただけないでしょうか。
自力でいいねボタンをつける方法を調べたりして、「do」さんのサイトで配布されているいいねボタンを導入しようとしたりしたのですが、うまく実装出来ませんでした。
個人サイトという、SNSよりも人目につきにくい場所では、いいねなどの反応があることが何よりの励みになります。投稿の1つ1つに、いいねなどのリアクションが押せる機能が実装されると、とても嬉しいです。
ご検討いただけますと大変嬉しいです。よろしくお願いいたします。
Onedriveを同期しないようにするときになんか色々した結果変な挙動をしてしまったんです!今は無事直りました!
>>5036
Onedriveに保存しているデータ自体はクラウド上に保存されているから、アプリをアンインストールしても消えないのでは…?ブラウザからOnedriveにアクセス して「サインイン」ボタンからログインして、「マイファイル」にデータが残っているか確かめてみてはどうでしょう。ここにデータがあればアプリをアンインストールしてもデータは残ります。
🥞Re:5030◆ご要望をありがとうございます。たしかに、1画像だけを消したいときには、現状のUIだと操作が面倒ですね。
🥞Re:5033◆ご要望をありがとうございます。なお、[[COMMENT:TITLE]] の代わりに [[COMMENT:LINE:1]] を使うと、1行目が空行のときには何も出力されませんのでお試し下さい。(ただし、1行目に画像等のオブジェクトがあると、それをそのまま出力してしまいますが。)
🆕 Ver 4.5.4βの更新点(概要):
《▼新機能》
●ユーザ一覧を出力できる記法 [[USERLIST]] と [[USERLIST:識別子]] を追加。
《▼仕様改善》
●投稿削除ボタンやカテゴリ削除枠の配色を(目立ちすぎる赤色から)灰色に変更。
《▼不具合修正》
(なし)
詳しい使い方などは、上記の開発進捗状況報告ページの記事をご覧下さい。
🍘SNSでのアナウンス:
Mastodon(Pawoo)
Bluesky
Twitter:
(ツイート埋め込み処理中...)Twitterで見る
#要望 なのですが、
1.[[COMMENT:TITLE]]について、1行目が空白の場合「No.123」形式の投稿番号が表示されますが、空白表示や指定した文言(「無題」等)の表示もできると嬉しいです。
2.「画像の管理」について、画像をファイル名順に並べ替える機能が欲しいです。
・管理TOP>画像の管理 ページで
チェックボックス下の「編集」の下に「削除」(単体削除リンク)が欲しいです。
(もしくは「編集」リンク先のページ内に「この画像を削除」のボタンが欲しいです)
スクロールなしで、ファイル情報を見ながらその場でパッと削除に行けたらうれしいです。
・「管理ページにスキン(ユーザースタイルシート)を使いたい→ブラウザ拡張機能で解決できます」という話題が以前あったと思うのですが、
私も、複数ブラウザ・端末を跨いでも維持できる「管理ページ用の上書きスタイルシート」みたいな設定を、てがろぐ自身でできたらいいなあと思う派です。(*.cssのURL読込でもベタ打ちでも)
下手すると動作に影響しそうなのと、実装大変そうなレスがあったので、あまり期待せずに言うだけ言ってみようの精神で言ってみます
いつも開発運営お疲れ様です。ありがとうございます☕️
🍛Re:5022◆情報ありがとうございます。WAF(Web Application Firewall)は、SQLインジェクションとかクロスサイトスクリプティング(XSS)とかに使われるような感じの投稿本文をチェックしてブロックしますからね。長い英文を貼り付けて投稿するだけでも、そこに「or」があって、遠く離れた位置に「=」とかの記号があるだけでもダメだったりしますし。とはいえ、WAFが使えるのならあえてOFFにはしない方が良いですから、いろいろ試していくしかないですね。^^;
🍛Re:5023◆てがろぐのご活用をどうもありがとうございます! 末永くご愛用頂ければ幸いです!(╹◡╹)ノ
🍛Re:5024◆情報ありがとうございます。WAFは、サーバに送信された文字列から「攻撃の可能性」を判断して通信をブロックするか通すかを決めますので、基本的にはスキンは無関係です。ただ、お使いのスキンに、何か必ず特定の文字列を付加して送信させるような特別なスクリプトがあるなら話は別ですが、たぶんそういうケースは滅多にないでしょうね。^^; なので、403になるパターンは、おそらく他のスキンを使っても403になります。半角の丸括弧 ( ) 記号の存在も誤判定によく影響します。(^_^;) 今更なんですけども、てがろぐの各種記法では、区切りに「/」を使って、オプションのカッコには < > を使うような、「攻撃だと誤解されにくい」書き方を採用していれば良かったな……、とは思います。(仕様を考えたときには、WAFにブロックされる可能性は全く想定していなかったもので。)
🍛Re:5025◆分かりやすい画像をありがとうございます。WAFのログをリアルタイムで確認できると、「何だと誤解されたのか」がハッキリするので良いですね。
→ https://youtu.be/iR0RG20neKI
もうちょっと解像度が高くないといけなかったかな……。ローカルで作成した動画は充分な解像度があったんですけども、YouTubeにアップロードすると画質が下がるんですかね……?
まあ、FTPソフトのUIは様々ですし、雰囲気が伝われば良いだろうとは思いますが。^^;(動画中のFTPソフトは、FFFTPです。)
なお、合成音声には VOICEPEAK という読み上げソフトを使いました。
