一つの文章を記憶して、その後にでてくる文章と共通の部分を探す。そして前後関係を関連付けする。文脈が読めないといけないけど、これは考え中。
形態素解析して組み合わせれば良いかなと思ったが赤ん坊はそもそも単語を知らないはず。何度か聞くうちに覚えるのであれば形態素解析は要らないんじゃないかなぁと。ただし、上の方法でやるとすればかなりプログラムが複雑化するし伴って実行速度が遅くなる気がする。(Margarineっていう人工無能は形態素解析してるようです)
男か女という性別はどうするんだろうか。

そもそも、そこまでプログラムできるほどのスキルがないんですがね・・・
やるとすればRuby+MySQL,php+MySQLかなぁ。phpはオブジェクト指向が完全じゃないし、Rubyは使ったことない&実行速度が遅い。