表示調整
閉じる
挿絵表示切替ボタン
▼配色
▼行間
▼文字サイズ
▼メニューバー
×閉じる

ブックマークに追加しました

設定
0/400
設定を保存しました
エラーが発生しました
※文字以内
ブックマークを解除しました。

エラーが発生しました。

エラーの原因がわからない場合はヘルプセンターをご確認ください。

ブックマーク機能を使うにはログインしてください。
とあるスコッパーの備忘録 ~良作発掘のためには手段は選びません~  作者: とあるスコッパー
4章-小説家になろう関連サイトを使った探し方

この作品ページにはなろうチアーズプログラム参加に伴う広告が設置されています。詳細はこちら

35/60

番外編4-小説家になろうの文体の閾値について解析してみた。

今回は真面目にやりました。

小説家になろうにおける文体の閾値解析

Threshold analysis of the buntai in Shosetsuka ni Naro


夕月悠里*1


1. 序論


 近年、出版不況と言われている中で、オンライン小説が人気を博している。そんなオンライン小説の火付け役となったのが小説家になろう[1]である。小説家になろうは現在、日本最大級のオンライン小説投稿サイトで2018年1月現在約54万件の小説が投稿されている。図1に年別の新作小説投稿数を示す。図から分かる通り新規作品の投稿数は年々増えており、2017年には年間に投稿される小説数が10万件を超えた。日本の統計2017[2]より、日本の書籍の年間出版点数はここ数年およそ8万点前後で推移している。この点を見ても、オンライン小説の人気の高さがうかがえる。


挿絵(By みてみん)

図1 小説家になろうの年別新作投稿数(削除、検索除外作品は除く)


 多くの小説が日々投稿される小説家になろうには、投稿された小説の検索を容易にするための様々なパラメータが設定されている。図2に本エッセイの小説情報の一部を示す。パラメータには読者が付けることができる評価ポイントや、ブックマークといったランキングのための情報や、キーワード、ジャンル、感想数、レビュー数、文字数などがある。その中の一つに文体というパラメータがある。図3になろうデベロッパー[3]による文体パラメータの説明を示す。文体パラメータは字下げや改行といった小説作法に関するもので、小説執筆のルールに基づいて書かれているか判断するために設定されている。


挿絵(By みてみん)

図2 とあるスコッパーの備忘録(Nコード:N5084EJ)の小説情報


挿絵(By みてみん)

図3 文体パラメータの説明


 オンライン小説は基本的に横書きで書かれており、横書きの状態で読まれることを想定している。しかし読者の中には紙の本に慣れており、縦書きで読みたいと思う人もいる。その読者層に用意されているのが小説家になろう関連グループの縦書き小説ネット[4]である。縦書き小説ネットは小説家になろうに投稿されている小説を縦書きで読むことができるサイトである。しかし、横書きで読まれることを想定された小説には改行が多く、縦書きの文章作法に準じていない作品も多い。そのため縦書き小説ネットに掲載される小説は、そういった縦書きでは読み難い作品を除外するためにいくつかの基準を設けてある。前述した文体もそのうちの一つである。

 縦書き小説ネットへの掲載条件のうち文体を除く他の条件は明確な基準が定められているが、文体だけは明確な基準が示されていない。また文体は試験提供機能であり、縦書き小説ネットに掲載されているものを除き、小説家になろうで明示的に知ることは基本的にできない。しかし、縦書き小説ネットに掲載されることを目的に書く場合はどのような基準が存在するか知る必要がある。またその逆で掲載されたくない場合も同様に条件を知っておく必要があるだろう。先行研究として、文体について述べられたエッセイ[5]が小説家になろうに投稿されている。しかし、そこでは改行に関するものに関してのみで、字下げに関する記述がない。

 そこで本研究では、文体分けに関する基準を明らかにすることを目的とする。基準となる値の閾値は具体的な数値で表し、小説投稿者が分かる形で明らかにする。

 

2. 調査方法


 序論でも述べた通り文体は試験提供機能であり、縦書き小説ネット以外では明示的に知ることは出来ない。また、それも文字数等の他の条件を満たした小説のみで、ほとんどの小説の文体は不明である。縦書き小説ネットに掲載されている小説数は2018年1月現在約5万件で、小説家になろうに投稿された小説数の約1割程度である。

 しかし、なろうデベロッパーで提供されているなろう小説APIを使用する事で文体を間接的に知ることが出来る。なろう小説APIでは文体の値そのものを取得することはできないが、検索パラメータとして文体を指定することで、対象となる小説の文体が分かる。具体的な調べ方としては小説家になろうに投稿した小説で、その調査対象の小説のみが検索される用にパラメータを調整する。例えばキーワードをタイトルにするなどその小説だけが検索結果に表示されるようにしておき、その検索パラメータに文体指定を追加する。文体を1、2、4、6と変えて検索結果が表示された時の文体がその小説の文体となる。よって、文体はこの検索結果で判断する。

 文体調査のための実験は、まず小説家になろうの小説投稿から実験小説を投稿し、字下げと改行のパラメータを変化させ閾値を調べる。その後実際に投稿されている小説で得られた閾値が正しいか検証する。


3. 実験結果


3.1 字下げと改行による閾値調査結果


 なろうデベロッパーの文体説明を見ると、字下げについての項目と改行についての項目がありその2つの結果から文体を決定していると考えられる。まずはその定義について調査する。

 小説家になろうの執筆フォームの入力補助メニューには自動字下げ機能がある。この機能を使うことで小説家になろうにおける字下げの定義を調査した。調査結果を図4に示す。自動字下げした後でも文頭に空白が挿入されていない文字がある。"「"や"『"等の括弧は字下げ対象に入らないことがわかる。また、括弧の頭に空白を挿入して自動字下げを行った場合は、括弧の前の空白が除去された。このことから字下げが適切であるかどうかは、文頭に括弧がある場合を除き、改行の後に空白を挿入している、または文頭が括弧の場合は空白を挿入していないことで判断されることがわかる。


挿絵(By みてみん)

図4 執筆フォームを利用した字下げの定義


 また先行研究より改行については明らかにされているので、簡単に説明する。文体の説明である改行の多寡は、空行によって判断される。空行とは何も文字が書かれずに改行された行の事である。全行数のうち空行が2割以内が改行が適切と判断される。ただし空行が連続した場合は1行の空行扱いとなる。

 以上の事から、計算式、閾値を判断するために、小説家になろうで小説投稿を行い文体のパラメータとなる値を変化させ、どのように文体が遷移するのか調査を行った。適切な字下げ行をaとし、不適切な字下げ行をb、空行をe、総行数をt、適切な字下げ率p、空行率qをとすると以下の式で表すことができる。ただし連続する空行は1とカウントする。そのため空行率の最大値は50 %となる。


挿絵(By みてみん)


 このパラメータを元に文体が変化する点を求めた。実験結果を図5、図6に示す。


挿絵(By みてみん)

図5 適切な字下げ率pと文体の関係(ただし空行e=0)


挿絵(By みてみん)

図6 空行率qと文体の関係(ただし不適切な字下げ行b=0)


 以上の結果から文体は以下に示す閾値で区分されていることが分かる。また図7に実験で求められた文体領域を示す。


挿絵(By みてみん)

図7 空行率qと適切な字下げ率pと文体の関係


3.2 投稿されている小説を用いた検証


 実験3.1で確認した文体の閾値が正しいかを実際に投稿されている小説で確認した。なろう小説APIを利用して文体1、2、4、6の小説のNコードを100個ずつサンプルとして取得、その本文を解析して文体分けの閾値通りに分けられている確認した。

 小説の本文を抜き出すためにのプログラムはExcel VBAで作成した。小説の本文の取得はVBAでIEを操作しHTMLのソースコードを抜き出す方法で行う。小説家になろうの閲覧ページとソースコードを図8に示す。


挿絵(By みてみん)

図8 小説家になろうの閲覧ページ(上)とソースコード(下)


 ソースコードでは改行は<Br>で表され、字下げはその後の文字を判断すればよいことがわかる。また、空行は<Br>が連続で続く場合をカウントする。ただし3つ連続する場合は空行は1にカウントする。実験結果を図9に示す。


挿絵(By みてみん)

図9 投稿された小説の文体と空行率qと適切な字下げ率pの関係


 実験3.1の結果と一致しており、閾値が正しいことが分かる。この結果によって文体分けの閾値が明らかとなった。


4. まとめ

 今回の研究により、文体の閾値が明らかとなった。縦書き小説ネットの掲載条件である文体6にするためには字下げが適切な割合を80 %超にし、空行割合を20 %未満にすればよいことがわかる。また字下げに関しては、小説家になろうの執筆フォームの自動字下げを利用することでほぼ確実に適切な字下げにできる。


5. 謝辞

 本研究は小説家になろうの評価、ブックマークの助成を受けたものである。この場を借りて多くの読者へ感謝の意を表する。


参考文献

[1] 株式会社ヒナプロジェクト、「小説家になろう」

[https://syosetu.com/](最終検索日:2018年1月26日)

[2] 総務省統計局、「日本の統計〈2017〉」日本統計協会、2017

[3] 株式会社ヒナプロジェクト、「なろうデベロッパー」

[https://dev.syosetu.com/](最終検索日:2018年1月26日)

[4] 株式会社ヒナプロジェクト、「縦書き小説ネット」

[https://pdfnovels.net/](最終検索日:2018年1月26日)

[5] nis、「タテ書き小説ネットに載ろう ~お薦め小説とは~」

[https://ncode.syosetu.com/n7579dm/](最終検索日:2018年1月26日)

*1 小説家になろうエッセイ部データ解析研究科


論文と言うよりはレターかショートノートな感じ。


また小説家になろうの論文としてはこんなのもあるよ↓


ひょうたんふくろう、「ゲル化剤を用いた巨大プリン製作についての考察―有限要素法によるバケツプリンの自重崩壊を起こすき裂発生点の同定」

https://ncode.syosetu.com/n0406du/

ひょうたんふくろう、「有限要素法による巨大ゼリー製作についての考察 ―炭酸系材料を用いた多層積層バケツゼリーの破壊メカニズムの検証―」

https://ncode.syosetu.com/n8811ef/


あと、閾値が本当にあってるかはわかんないし変わる可能性もあるので注意。

これ以外の条件もあるかもしれないね。正直、帰納法だから何とも言えない。

評価をするにはログインしてください。
ブックマークに追加
ブックマーク機能を使うにはログインしてください。
― 新着の感想 ―
このエピソードに感想はまだ書かれていません。
感想一覧
+注意+

特に記載なき場合、掲載されている作品はすべてフィクションであり実在の人物・団体等とは一切関係ありません。
特に記載なき場合、掲載されている作品の著作権は作者にあります(一部作品除く)。
作者以外の方による作品の引用を超える無断転載は禁止しており、行った場合、著作権法の違反となります。

この作品はリンクフリーです。ご自由にリンク(紹介)してください。
この作品はスマートフォン対応です。スマートフォンかパソコンかを自動で判別し、適切なページを表示します。

↑ページトップへ