データとデータベース

はじめに

現代社会は情報社会とも言えます。
この情報社会を生き抜くためには情報を上手に活用し、情報に惑わされない力が必要になっているかと思います。

SNSの発達により情報のやりとりは簡単になり、たくさんの情報を送受信することが可能になりました。しかし、たくさんの情報の中から重要な情報を探し出すのが非常に困難になっていることもあります。

重要な情報を得る手段の一つにAIがあります。AIは重要な情報ほど重みが大きくなり、重要な情報とそれ以外の情報を分けることができます。しかし、AIも万能ではありません。

AIが学習する情報に余計なものあればあるほど重要な情報を引き出す精度が悪くなります。そのため、学習する情報は人が選びだす必要があります。

そこで、今回は人が扱える範囲で情報を整理し、人やAIが使えるように整備していきたいと思います。そのために、データとデータベースを理解し、情報を使う側になりましょう。

データとデータベース

データ

私が思うデータというものは

「コンピュータが扱えるものすべて」

と考えています。抽象的で分かりにくいと思いますので、身近なものだとExcelです。Excelで扱えるものすべてはデータと言えますし、Excel自体もデータと言えます。

例えば、YoutubeやX(旧:Twitter)などの場合、ユーザ名やパスワード、お気に入り、登録チャンネル、フォロワーなどすべてが情報になります。

データベース

このデータを集約して扱いやすくしたものがデータベースです。

集約するためには型を決めます。その型に当てはめるように集約します。

型というのは列名だと思ってください。ExcelだとA列、B列、C列、…です。例えば、SNSなどの場合い、以下のようなデータベースが作成できるかとおみます。

ユーザ名パスワード登録チャンネルお気に入り・・・
AAAABC
BBBBCD
CCCCDA
DDDDAB

集約ができたので、扱いやすくするために、データの加工をしたり、分けたりします。上記例の場合、登録チャンネルが10万人以上なら別のデータベースへ移動などが扱いやすくする工夫の一つです。こういった処理を行うことで処理速度が上がったり、AIの精度が上がったりします。

データベースの操作

これでデータベースが完成します。データベースを作ることも大きな仕事ですが、データベースの重要なところは参照したり、追加したり、削除したりと管理ができるという点です。次にその操作の例を紹介します。

まずは、最も使われる参照です。参照は以下の図のような流れで操作します。

参照するためにはインプットを設定します。ここではBさんのお気に入りしている人をインプットとして設定します。それをデータベースにアクセスすると赤矢印のようにユーザ名を検索してBさんを特定します。その後お気に入りの列まで移動し、そのデータをアウトプットします。その結果が参照値となります。今回の場合、Dさんがアウトプットとなります。これが参照です。

次に追加と削除です。これは簡単で、Eさんが登録されたら1行追加してEさんを追加するだけです。削除は逆でEさんの行を削除するだけです。

以上がデータベースの操作の例です。

コメント

タイトルとURLをコピーしました