正規表現
まず商品マスター整備を行う。
重複。同じ商品が複数登録されていること。その大きな原因が表記揺れだ。「ノートA」と「Aノート」と「ノート-A」のように同じ商品を違う書き方にして、それを別のものとして扱ってしまう。
半角カナや全角英数字、そして機種依存文字は検索性を損なう。そして表記揺れの元となることもある。百害あって一利なし。
全角スペース、連続スペース、タブ文字。これらは目で見ればただの空白だ。すべてただのスペースに置き換えるべきである。
カンマや句読点。商品には含まれにくい文字。うちの商品にも使われていなかったはずだが、ルール化はされていたっけ。もしなかったらそう決めよう。特にカンマはCSVを扱うなら大敵。Comma-Separated Values の名前の通り、CSVでカンマは機能を持つ。間違いどころかデータを壊してしまいかねない。
正しくないものは美しくない。そうつぶやいて Excel を閉じ、秀丸エディタで開き直す。まずは空白文字をただのスペースに置換する。
現行商品は400品ほど。色違いが一緒になっているものや番号が飛んでいるものもある。すべてを整理すると500SKUくらいになるだろう。しかしその半分くらいは特定の相手にしか売らない仕様品で、一回限りの特注も多い。それもわかるようにしないと。注文を受ける可能性があるなら登録しないわけにはいかない。でもどれがそうなのかよくわからない。さらに廃盤商品を入れれば3000SKUを超えると工場の生き字引は言っている。それは現段階では不要な情報だ。もし廃盤復活があれば新商品として登録するべきだ。電子化前の廃盤商品を登録してなんの意味がある。
次に色を別項目に分割する。仕様または属性はひとつでいいのか。赤くて大きいとかないのか。わからない。今は色カラムだけ分割しておく。いや、でもすこしだけ心配だから一列空けておこう。
SKUとは何か。それは立場によって異なる意味を持つことがある。商品、製品、在庫品、どれもSKUとして扱える。だがこれは商品マスターなのだから、SKUは売り物のラインナップを意味するのだ。売っているもの、売れる可能性のあるものは登録対象となる。
それから他社製品で、うちで売ってるものは登録する。およそ200SKU。これは他社製品に付いてきた品番にプレフィックスを付けて結合する。
プレフィックスは最初が「Z」で、次をメーカーの名前から取る。それらは項目を作って「仕入」としておく。問題は、すでにいくつかが登録されていて、うちの商品に混ざってしまっていること。これも重複と同じだ。
重複はひとつを残して、廃盤扱い。対照表を別に作って参照させる。仕入れ商品の場合はZ番を正とする。今回はほとんどゼロからマスターを作るようなもので、削除しても高確率で問題になるはずもない。それでも登録するのはそれが商品だからだ。
さて他社製品に商品番号を付けてしまったが、自社製品の番号は「旧番号」の項目に入れてしまった。並んでいるのはすべて仮番号。その理由は、廃盤商品の2500SKUの番号がわからなかったから。既存の品番の隙間に色違いを追加した結果、過去の商品の番号とぶつかる危険がある。その可能性がどれだけ少なくとも考える必要はある。あと足りないものはロットと単位と原価。これもまた工場に聞かないといけない。どうせ Filofax にあるんだろう。
命名規則があいまいだ。商品を売る人間とも話すべきだ。だが営業部は若いのがひとりしかいない。




