Rubyの文字化けを直す方法を現役エンジニアが解説【初心者向け】

初心者向けにRubyの文字化けを直す方法について現役エンジニアが解説しています。文字コードとは、アスキーコードから派生したShift-JISやUTF-8のことです。文字化けは表示に指定した文字コードと違う場合に起こります。Rubyでファイルに文字コードを指定する方法について解説します。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

Rubyの文字化けを直す方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。

そもそもRubyについてよく分からないという方は、Rubyとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプRuby講座の内容をもとに紹介しています。

 

田島悠介

今回は、Rubyに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Rubyの文字化けを直す方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

目次

1時間でできる無料体験!

 

文字コードとは

文字コードとは、言葉として使われる文字を数値で表現をしているコードのことを指します。

この文字コードはASCIIコード(アスキーコード)が基本となっており、Shift-JISやUTF-8はASCIIコードkら派生した文字コードです。

ASCIIコードではA〜Zのローマ字などを数値として表現していますが、大文字だけではなく小文字のa~zも1文字ずつコードで表現されています。

ASCIIコードではローマ字以外にも!、”、#、$、%、&、’、(、*などの特殊な文字やNULLやBS(バックスペース)なども同様のコードで表現されています。

このASCIIコードには日本語の表現がありませんが、日本語の文字を加えた文字コードにはShift-JISがあります。

他には、日本語以外にも多言語を表現することができる国際的コードとしてUTF-8があります。

UTF-8は国際的な文字コードとしてWeb上などでは多く使われています。
 

[PR] Rubyのプログラミングで挫折しない学習方法を動画で公開中

文字化けを起こす原因

文字化けを起こす原因としては、上記のような複数の文字コードがそれぞれ互換性がない文字あるというところです。

UTF-8で表現されている文字を、Shift-JISで表現すると「�」のような文字で表示されたりします。

また、エクセルのCSVファイルなどのバイナリファイルがShift-JISで表現されている場合にRubyでそのファイルを読み込んでしまうと、Rubyは文字コードがUTF-8となっているため、文字化けが発生していしまいます。
 

Rubyの文字化けを直す方法

文字化けを直す方法としては、開発環境として英語堅のブラウザやプラットフォームを使用している場合には、HTMLとしても確認が必要です。

headタグの中にmetaタグを記述をしてUTF-8の指定をすることも有効です。

(app/layout/application.html.erb)

<head>
  <% set_meta_tags charset: 'utf-8' %>
</head>

UTF-8ではないファイルを、以下のように記述しUTF-8として読み込みます。

(sample1.rb)

puts sample0.encode(Encoding::UTF_8)

 

コラム

実は私も!?独学で損する人の特徴

「スクールは高いから独学で成功する」という気持ちの方は多いと思います。
もちろんその方が金額は低く抑えられるでしょう。
ただ 独学には向き不向きがあり、実はスクールが向いている人も大勢います。

そんな方のために参考として、 テックアカデミー卒業生がスクールを選んだ理由 をご紹介します。

  • ・困って挫折しそうなときに、質問や相談できる相手がいる環境で学んでいきたいなと思った
  • ・わかった気になっているだけだったので、自分を追い込む環境に置いた方がいいと感じた
  • ・スクールのカリキュラムで市場に求められるスキルを学ぶべきと思った

少しでも当てはまる部分があれば、 スクールが向いているかもしれません。
お試しのつもりで、まずは一度 無料相談 に参加してみませんか?

現役エンジニア・デザイナーに何でも気軽に相談できる30分すべて無料で できます。
無理な勧誘は一切ない ので、お気軽にご参加ください。

今なら相談した方限定の割引・参加特典付き! 無料相談はこちら

まとめ

データの文字コードの形式は開発環境や元データによってさまざまです。他の文字コードなどのデータを変換することをエンコードと呼びますが、文字化けを解消するためにエンコードすることは必須となります。

まずは元のデータがどの文字コードで構成されていいるか把握することが大切です。
 

筆者プロフィール

木村勇土

TechAcademyの現役メンター。

現在は行政書士事務所を運営しており、お客様にはプログラマーやフリーランサーも多い。
WordPressを中心とした自社のWebサイトの修正などを行なっている。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でもRuby on Railsを使ったプログラミングを習得できるオンラインブートキャンプRuby講座を開催しています。

挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。

初心者・未経験でもできる。まずはテックアカデミーに相談しよう

プログラミングを独学していて、このように感じた経験はないでしょうか?

  • ・調べてもほしい情報が見つからない
  • ・独学のスキルが実際の業務で通用するのか不安
  • ・目標への学習プランがわからず、迷子になりそう

テックアカデミーでは、このような 学習に不安を抱えている方へ、現役エンジニア講師とマンツーマンで相談できる機会を無料で提供 しています。
30分間、オンラインでどんなことでも質問し放題です。

「受けてよかった」と感じていただけるよう 厳しい試験を通過した講師 があなたの相談に真摯に向き合います。

「ただ気になることを相談したい」
「漠然としているがプロの話を聞いてみたい」

こんな気持ちでも大丈夫です。

無理な勧誘は一切ありません ので、まずはお気軽にご参加ください。
※体験用のカリキュラムも無料で配布いたします。(1週間限定)

今なら参加者限定の割引特典付き! 無料相談を予約する