GoogleドキュメントをHTMLに変換「ポチッとHTML」-スプレッドシート(GAS)版
※購入後にまたリンクが欲しい方、Stripe側のデータと照合して再送付いたします。購入時のメールアドレスを添えて諦めずにご連絡を。
Googleドキュメントに執筆した文章を、HTMLに変換する際には「Docs to Markdown」というアドオンが一般的に使われます。
ただ、テーブルのヘッダーセルを指定できなかったり、HTML化したあとにタグを書き換えたりするのが本当に面倒で(筆者が…)。
そこで、この悩みを解決するべくスプレッドシートの「Gas(Google Apps Script)」で、GoogleドキュメントにあるテキストをHTMLに変換する「ポチッとHTML」を制作しました。
- GoogleドキュメントをHTML化できる
- タグは細かく設定して面倒な手間を省ける
- →つまり、サクッとHTML化して入稿の時間を短縮できるツールです。
編集権限のあるGoogleアカウントがあれば誰でも使えて、HTMLの指定はシートごとでバラバラに設定できます。
簡単な初期設定だけしておけば、あとはボタンを押して実行するだけです。
「ポチッとHTML」は980円(税込)の買い切りで、購入後にスプレッドシートをフォルダにコピーするだけで利用を開始できます。
個人利用の範囲であれば、Gasに書かれたコードを改変しても問題ありませんし、ライターに配布しても構いません(カスタマイズはお問い合わせより、相談いただければ柔軟にお見積りします)。
【実際のテストGoogleドキュメント】
詳細な使い方のマニュアルもスプレッドシートに添付していますので、ぜひご利用ください。
目次-気になる内容だけ読む-
- 更新履歴
- 仕様を簡単に列挙
- ポチッとHTMLの主な機能
- 好みで設定できるHTMLのオプション
- ポチッとHTMLに寄せられるよくある質問
- ポチッとHTMLはGoogleドキュメント以外に対応していますか?
- 対象となる文章の範囲はどこまで?
- どのように判断してHTML化されていますか?
- 表が正常に変換できないのはなぜですか?
- 正常に動作せずにエラーが起きるのはどうして?
- 見出しの太字が反映されないのはなぜ?
- 入力したデータはどこかに送信されますか?
- 入力したクレジットカードの情報やアドレスはどうなりますか?
- 購入したスプレッドシートのプログラムが動かなくなったときは?
- 目次オプションがH4までなのにIDはH5まであるのはなぜ?
- フォルダの保存先は変更できますか?
- ①コピーする際に指定する
- ②コピーした後に移動する
- 「Exception: ドキュメントにアクセスできません。しばらくしてからもう一度お試しください」と表示される
- 記述されているコードが汚くて読めません。
- ポチッとHTMLのダウンロード
更新履歴
最近
- 目次の不具合を修正(14日)
- H5のタグ不備を修正(14日)
- 動作確認(14日)
- 当該エラー購入者のアドレスへ本製品を再送付(14日)
2024年
- デモのGoogleドキュメントを公開(2月)
- プログラムの軽量化で約20〜40秒で完了(2月)
- 表の入れ子に対し、表とリストへ対応(2月)
- 入れ子で使ったときにズレが発生する不具合の修正(2月)
2023年
- 入力値となるドキュメント原本からHタグが消える不具合を修正(2023年2月)
- 微弱なズレの修正(2023年更新)
- Aタグの不具合を修正(2023年更新)
仕様を簡単に列挙
ちなみに、出力しているHTMLは本当に変換しているだけであるため、プログラムコードのように整理されておりません。
- テキストタグ全般(太字や下線):段落・リスト・表に対応。ただし、表における太字のみはTHのためのフラグとして使っており未対応。また、ヘッダーも未対応
- Pタグ:空行の処理(空の行)を飛ばす
- リストタグ:番号、弾丸(・)のみ対応
- Aタグ:下線を反映しないシンプルなA
- 表(テーブル)THタグ:セルの最初の文字を検知して太字ならTH処理
- 目次生成:見出しテキストをIDにして設置
- 表(テーブル)の入れ子:表の中の表まで。2つ以上(表の中にある表の中、さらに表)は技術的に可能だが面倒なので非対応
- 表(テーブル)のリスト入れ子:対応済み、ただし番号・弾丸のいずれか(混在は最初の要素に従うため、最初が弾丸なら弾丸で終わる)
- 表(テーブル)のセル内改行:例に漏れなくすべてBRの改行タグに変換。部分的にトルツメすると誤作動するほか、入れ子に対応するため。
- 区切り線:未対応(取得不可)
そのほか、よくあるHTMLタグで構成されております。
なお、タグはお好きなように切り替えられ、Pタグに対してSPANを当てるということも可能です。
ポチッとHTMLの主な機能
ポチッとHTMLは、Googleドキュメントで作成した文章を指定のタグでカスタマイズできる「HTML変換ツール」です。
主な機能は、以下のとおりです。
- Googleドキュメントの文章をHTMLへ変換する
- 指定した対象のテキストを一括置換できる
- クライアントごとにHTML設定をシートで変更できる
Googleドキュメントの文章をHTMLへ変換する
ポチッとHTMLでは、対象となるGoogleドキュメントの文章を、指定したHTMLタグを使って変換してから別シートへ出力します。
書式設定を読み込みますので、余計なタグを設定しなくてもそのまま変換できます(デフォルトでH2・H3・H4のタグは変換前に自動削除しています)。
お好きなHTMLタグを設定できますので、太字装飾を変換して黄色下線といった形で有効活用していただければと思っています。
また、HTMLはいつでもカスタマイズできますので、急な仕様変更があってもおおよそは対応できるはずです。
表のthタグの設定は太字で対応
表をHTML化する際にネックとなるのが、<td>を<th>(いわゆるヘッダー)に変換する方法です。
ポチッとHTMLでは、ヘッダーに変換したい部分だけ太字を反映していただければ、自動的に<td>が<th>に変換されます。
対象となるセルの1文字目をチェックしているため、空欄が入っていたり、最初の文字だけ太字でなかったりする場合には動作しません。
なお、表にリストを埋め込むといった入れ子構造には対応しておりません。
指定した対象のテキストを一括置換できる
ポチッとHTMLには、ただHTMLに変換するだけではなく、一括でテキストを置換する補助機能を備えています。
個人で別に販売している「ポチッとテキスト(後述)」よりは劣りますが、正規表現で一致したもの「すべて」を変換できます。
例えば、内部リンクを差し込みたい場所に「★」を記述し、そのまま置換するといった形です。
また、通常のHTMLタグでは対応しきれないもの(divを追加する等)も、特定のテキストを付与して置換するだけでまとめて設定できますので、面倒な手間を一定以上カットできます。
ポチッとテキストとの違い
ポチッとHTMLは、あくまでも変換が目的ですから、文章の置換の精度はポチッとテキストより低いです。
例えば、以下の場合もすべて対象となりますので、表記統一のための一括変換にはリスクがあります。
- 見出し
- リスト
- 表
一方で、ポチッとテキストは置換対象をそれぞれ指定でき、無駄な置換のロスはありません。
ポチッとHTMLでは、HTMLの変換を補助する程度としてお使いください。
※ポチッとテキストの詳細はこちら
クライアントごとにHTML設定をシートで変更できる
ポチッとHTMLは、変換するHTMLをシートごとに設定できるよう作られています。
例えば、A社にはA社のシート、B社にはB社のシートといった形で設定しておくと、複数の媒体にも対応できるわけです。
意外にも、<p>タグを<span>にしてほしい、<b>タグを<strong>にしてほしいといった細かい違いがあります。
こうした際にも迅速な対応を求められることから、個人的にも便利だと思って追加した機能です。
好みで設定できるHTMLのオプション
ポチッとHTMLでは、好みにあわせられるように個別で以下のオプションを用意しました。
- 目次
- ID
- Aタグ
目次オプションでは、H2〜H4までのタグにID用の「#〜〜〜」を付与できます。
IDオプションと組み合わせると、すべてH4まではリンク化できますので、目次を別途で作るときに便利です。
また、目次はデフォルトでリスト化しますが、リストを外して設定したタグだけを付与したものを出力できます。
Aタグオプションでは、以下の4種類を追加で変換できます。
- 新しいタブで開く
- rel = “nofollow”を追加
- rel = “sponsored”を追加
- rel = “UGC”を追加
ただ、Gasの使用上すべてのAタグに入ってしまう点だけは、ご了承ください。
»利用規約はこちら
ポチッとHTMLに寄せられるよくある質問
ポチッとHTMLはGoogleドキュメント以外に対応していますか?
申し訳ありませんが、Googleドキュメントのみとなっております。
Wordを扱う場合は、Driveに保存し、Googleドキュメントに変換してからお使いくださいませ。
対象となる文章の範囲はどこまで?
Googleドキュメントに記載されているテキストがすべて対象となります。
置換したくないテキストを取り除き、タイトルからまとめまでをGoogleドキュメントに転記して使ってください。
どのように判断してHTML化されていますか?
Googleドキュメントにある書式設定の機能を、Gasで読み取り反映しています。
そのため、Hタグがついていても標準テキストとなっていれば、Hタグは反映されません。
リストや表も同様です。
表が正常に変換できないのはなぜですか?
ポチッとHTMLでは、ヘッダーに変換したい部分だけ太字を反映していただければ、自動的に<td>が<th>に変換されます。
変なところに入っていても、そのセルはヘッダーです。どう足掻いてもヘッダーになります。
そして、太字の装飾は反映しません。
また、セル結合された表には対応しておりません(アップデートしようかは迷い中です)。
2024年2月に表のリストと表に入っている表へ対応しました。
正常に動作せずにエラーが起きるのはどうして?
正常に動作しない場合は、意図しない配置になっている可能性があります。
- 表に表さらに表が入っている
- Googleドキュメントが対象になっていない(.Docsは未対応)
- ドキュメントのURLをチップにしている
- 入力しているHTMLに誤り(空欄や変なタグなど)がある など
なお、筆者の個人仕様で作られており、セル結合が嫌いなので対応してませんし、表リストを埋め込むといった入れ子構造にも対応しておりません。
2024年2月に表のリストと表に入っている表へ対応しました。
見出しの太字が反映されないのはなぜ?
Googleドキュメントの使用上、以下のフォーマットから貼り付けた際に強制的に太字等の装飾が入ってしまうため、反映しないよう調整されております。
- Notion
- Googleドキュメントの既存設定(H3の規定値)
- AIツール ほか
お手数をおかけいたしますが、手動または置換リストをお使いください。置換リストは、すべての変換が完了したあとに実行されるものです。
そのため、ヘッダーのタグを対象とする置換で変更できます。
入力したデータはどこかに送信されますか?
購入されたスプレッドシートからデータを収集したり、Googleドキュメントからテキストを読み込んだりはしません。
ポチッとHTMLでは、テキストをHTMLに変換したり、テキストを置換したりする機能のみが備えられています。
なお、セキュリティ基準はGoogleが独自に設定しているため、弊社では変更できませんことご了承ください。
入力したクレジットカードの情報やアドレスはどうなりますか?
Stripeによる決済を採用しており、クレジットカード情報の収集・保管はおこなっておりません。
また、入力されたアドレスにつきましても同様です。
購入したスプレッドシートのプログラムが動かなくなったときは?
付属しているマニュアルをお読みいただき、操作方法にお間違えがないか確認してください。
また、作者のミスによって動作しない場合に限り、無償で修正しますので、お問い合わせください。
本製品は毎月動作を確認していますが、Google側のアップデートによって正常に動作しなくなる場合があります。
目次オプションがH4までなのにIDはH5まであるのはなぜ?
なぜでしょう?作者もよくわかりませんが、何かに使ったまま残していたのだと思います。
個人で使っていたシートを調整して販売しているだけですので、どうしても不思議な部分ってありますよね。
フォルダの保存先は変更できますか?
フォルダの保存先を任意の場所に変更することもできます。方法は2種類ありますので、ご自身に合ったものをお選びください。
①コピーする際に指定する
スプレッドシートをコピーする際に、フォルダを指定できます。
なお、保存したフォルダでは「編集者」の権限が必要です。閲覧者等では、プログラムの実行においてエラーが発生します。
②コピーした後に移動する
スプレッドシートをコピーしたあとに、フォルダを指定できます。
こちらも同様に、権限の付与が正しく行われている必要がありますので、ご注意ください。
「Exception: ドキュメントにアクセスできません。しばらくしてからもう一度お試しください」と表示される
こちらのエラーメッセージには多くの情報が含まれています。想定されるものを列挙しますので、ご確認をお願いします。
- 対象のドキュメントがWordである→こちらはWordをGoogleドキュメントに変換の上、実行をお願いします。
- アクセス権限が足りていない→Googleドキュメントのアクセス権限が編集者でなければ実行できません。権限をご確認ください。
- 情報量が多すぎる→Googleドキュメントにある情報量(文章量)が15,000文字を超えている場合には動作が重くなることがございます。場合によっては分割していただくと改善することがあります(こちら軽量化に向けて現在調整中です)。
そのほかにも、回線および端末が重くなっていること、セキュリティソフトによる阻害、複数のGoogleアカウントでのログインによって権限のないもので実行しているなどが挙げられます。
なお、Google側で発生したエラーによっても引き起こされます。ブラウザの再起動およびキャッシュの削除を実施し、同様の不具合が出た場合は1時間ほど開けて実行してみてください。
記述されているコードが汚くて読めません。
個人で利用していたもの(そもそも作りながら育てたもの)をベースに、不要部分をカットした製品ですので、いわゆるスパゲッティーコードと呼ばれる状態のままです。
本当に申し訳ないのですが、「動けば良い→テストを続ける→整理して綺麗にする」という形でリリースしているため、今後の対応をお待ちください。
ポチッとHTMLのダウンロード
「ポチッとHTML」は980円(税込)の買い切りで、購入後にスプレッドシートをフォルダにコピーするだけで利用を開始できます。
個人利用の範囲であれば、Gasに書かれたコードを改変しても問題ありません。
»利用規約はこちら
詳細な使い方のマニュアルもスプレッドシートに添付していますので、ぜひご利用ください。